from re import findall
from urllib.request import urlopen
pattern='data-type="jpeg" data-src="(.+?)"'
result=findall(pattern,content)
for index,item in enumerate(result):
with urlopen(str(item)) as fp:
with open(str(index)+'.jpeg','wb') as fp1:
fp1.write(fp.read())
结果是程序结束返回零值
是哪里出错了吗,看网页的源码是data–type”.jpeg”结尾。真的不知道哪里有问题了
正则pattern写得不正确,导致无法获取到链接,应写成:
pattern = r'<img class="rich_pages wxw-img" data-croporisrc="(.+?)"',即可获取图像链接:
import re
from urllib.request import urlopen
url='''要请求的url'''
content=urlopen(url).read().decode()
#print(content)
pattern = r'<img class="rich_pages wxw-img" data-croporisrc="(.+?)"'
result=re.findall(pattern,content,re.S)
print(result)
如对你有帮助,请点击采纳按钮。
可能,你需要深入交流