#!/usr/bin/python
import re
import urllib.request
def getHtml(url):
page=urllib.request.urlopen(url)
html=page.read()
return html
html=getHtml("http://tieba.baidu.com/p/3205263090")
html=html.decode('UTF-8')
def getImg(html):
reg=r'src="(.+?.jpg)"pic_ext'
imgre=re.compile(reg)
imgList=re.findall(imgre,html)
return imgList
imgList=getImg(html)
imgName=0
for imgPath in imgList:
f=open("F:/pic/"+str(imgName)+".jpg",'wb')
f.write((urllib.request.urlopen(imgPath)).read())
f.close()
imgName+=1
print("all done")
代码如上,在f盘的pic文件夹下找不到图片。
你的正则有点问题
我写了一个类似的方法,亲测可用,可以参考一下
# -*- coding: utf-8 -*-
import re
import requests
url = "http://tieba.baidu.com/p/3205263090"
html = requests.get(url).content.decode('UTF-8')
reg = re.compile(r'BDE_Image" src="(.+?\.jpg)" pic_ext')
img_list = reg.findall(html)
for idx, img in enumerate(img_list):
with open('F:/pic/{}.jpg'.format(idx), 'wb') as f:
f.write(requests.get(img).content)
print("all done")
运行结果如下:
我换了一个新的url就不可以了,是不是有贴吧有反爬虫啊
。
你好,运行时能够运行,怎么找不到图片呢