博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python抓取妹纸图
阅读量:5239 次
发布时间:2019-06-14

本文共 1115 字,大约阅读时间需要 3 分钟。

import urllib.requestimport reimport osre_img = re.compile(r'

') # 预编译正则, 提高代码效率re_url = re.compile(r'http://aimm\.92game\.net/xinggan/(\d+)\.html')f2 = open("456.txt")headers = { 'user-agent': 'Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.23 Mobile Safari/537.36', # 伪造手机UA来访问手机端网页}pic_num = 0os.chdir("G:\\meizhi-image")for each_url in f2: each_url = 'http://m.aimm.92game.net/n.php?id=' + re_url.findall(each_url)[0] # 把电脑版url转换手机版方便抓取 url_image = urllib.request.Request(each_url, headers=headers) url_image2 = urllib.request.urlopen(url_image).read().decode("utf-8") url_image3 = re_img.findall(url_image2) for each in url_image3: pic_num += 1 url_image4 = (each) path = (str(pic_num) + '.jpg') print("... ... 第"+str(pic_num)+"只妹纸正在被保存... ...") image = urllib.request.urlopen(url_image4) image1 = image.read() f = open(path, 'wb') f.write(image1) f.close()

python3.4 第一只爬虫,主要用到urllib,request。正则表达式。代码比较渣渣

转载于:https://www.cnblogs.com/yefengpython/p/5305657.html

你可能感兴趣的文章
第 十一 次作业
查看>>
利用PHP SOAP实现WEB SERVICE[转载]
查看>>
android:scaleType属性
查看>>
Programming In Scala笔记-第十五章、Case Classes和模式匹配
查看>>
CDOJ 1636 梦后楼台高锁,酒醒帘幕低垂
查看>>
SuperEPC
查看>>
RBAC用户角色权限设计方案
查看>>
repeater做删除前弹窗询问
查看>>
thymeleaf
查看>>
CentOS7安装iptables防火墙
查看>>
mysql-5.7 innodb 的并行任务调度详解
查看>>
shell脚本
查看>>
Upload Image to .NET Core 2.1 API
查看>>
python针对excel的读写操作-----openpyxl
查看>>
最后几本书,不珍藏了。
查看>>
Js时间处理
查看>>
Java项目xml相关配置
查看>>
按钮实现A标签新窗口打开(不用window.open)
查看>>
Array对象
查看>>
MainActivity
查看>>