selenium请求url 响应有乱码,但是ctrl+s保存又正常

img


源数据中文有乱码,selenium请求这个路径后page_source有乱码,但是网页ctrl+s保存又显示正常

img

乱码没关系,抓到数据之后转换一下编码格式就行了

乱码不影响的,有时候那个预览确实会显示乱码,你保存的文件没有问题,就OK,不用在乎!

这种还是比较常见的,属于正常现象,就是访问目的地返回的信息有问题收到网络波动都会乱码,偶现的这种

你是用什么开发语言进行的,
首先命令行输入chcp查看系统默认编码格式
我电脑的默认编码格式就是cp936
运行配置中加上VM选项-Dfile.encoding="cp936"
就可以解决问题
cp936也可以换成GBK(cp936其实就是GBK)

1.pagesource得到的结果是源代码字符串;
2.用字符串设置编码utf8读取即可。

这和保存文本编码有关,浏览器自带解析编码,所以浏览器没有问题,可以尝试保存UTT-8形式再打开看看