用正则来爬取(https://imagebaiducom/)这个网址首页的6张图
<1>注意是首页的六张图
<2>将所有的图片存储到百度图片`文件夹中该文件夹是通过代码实现的
<3>图片的名字以网站中图片所对应的名字来命名
import re
import requests
import os
url = 'https://image.baidu.com/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
path=r"e:/百度图片"
res=requests.get(url,headers=headers)
img = 'style="background-image: url\((.*?)\); background-color:'
name='<div class="bd-home-content-album-item-title "> (.*?) </div>'
images = re.findall(img, res.text)
name=re.findall(name, res.text)
name.append("其它")
folder = os.path.exists(path)
if not folder:
os.makedirs(path)
for n in range(len(images)):
res=requests.get(images[n],headers=headers)
with open(f'{path}/{name[n]}.{images[n][-3:]}','wb') as f:
f.write(res.content)
f.close()
python版本: python3
用到的包:from PIL import Image
Image下载:
pip install pillow
# 打开图像
im = Image.open(r'img/1.jpg')
# 图像旋转,两种方法:
new_img1 = im.transpose(Image.ROTATE_270) # 逆时针旋转270(有些人抄都不会抄,还顺时针呢)
new_img2 = im.rotate(90) # 逆时针旋转90
"""
这里说一下这两种方法,new_img1就是单纯的旋转了图片的方向。new_img2在旋转以后,可能会发生裁剪(一般不推荐2)。
"""
# 保存文件
new_img.save(r'img/1.jpg', quality=95, subsampling=0)
"""
save()方法里:参数quality=95, subsampling=0是为了防止图像的压缩,百度有详解,这里不再赘述。
"""