爬虫…显示的这是什么编码?

'2020å¹´æ\x88\x91å\x9b½â\x80\x9cä¸\x89æ\x96°â\x80\x9dç»\x8fæµ\x8eå¢\x9eå\x8a\xa0å\x80¼ç\x9b¸å½\x93äº\x8eå\x9b½å\x86\

在浏览器打开网页信息看看是这个编码,如果不是,说明你爬取的数据乱码了

查看一下网页编码方式

img

使用采集过程中,返回对象的 content,对这个2进制字符串进行解码

https://blog.csdn.net/superwfei/article/details/118155822?spm=1001.2014.3001.5502,可以参考我的问题,除了编码问题,还有压缩问题,检查 content-encoding 是否使用了压缩格式