python 爬取后一直有一小段是乱码,不知道这是怎么回事

请问这是怎么回事啊
这个我找了很多地方,可还是不知道怎么去修改,才开始学,难以下手

img

img

你requests 读取页面文件的编码不对 ,用 res.encoding='utf-8'或res.encoding='gbk'设置下读取页面文件用的编码, 再获取res.text即可,比如

res=requests.get('http://www.xxxx.com')
res.encoding='utf-8'
#或res.encoding='gbk'
print(res.text)

或者也可以设置 res.encoding=res.apparent_encoding 自动从网页的内容中分析网页编码

如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

img

您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632