爬虫爬取妹子图片,仅供娱乐
利用正则匹配,在百度帖吧中匹配html中的每个妹子页面的地址,然后再匹配 妹子页面中的照片,然后下载就ok啦,仅供练习娱乐哦
看看效果如何吧

图片不敢放太大,影响很不好*-*
下面就是代码:
import urllib.request
import re
import osdef open_url(url):#设置访问网站时的headerreq=urllib.request.Request(url)req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36')#使用设置的header访问网站page=urllib.request.urlopen(req)#获得网页代码htmlhtml=page.read().decode('utf-8')return htmldef get_img(path,html):p=r'
下一页'#获取下一个页面的地址next_url='https:'+re.findall(p,html)[0]start(next_url,count,path)if __name__ == '__main__':#主页urlurl='https://tieba.baidu.com/f?kw=%C5%AE%C9%F1&fr=ala0&tpl=5'path=input('输入妹子图片要存储的路径:')count=int(input('输入需要爬取的页数:'))start(url,count,path)
这种东西,在好人手里就是陶冶情操,在坏人手里就是低俗下流。我相信大家都是好人,嘿嘿嘿
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
