乱码没关系,抓到数据之后转换一下编码格式就行了
乱码不影响的,有时候那个预览确实会显示乱码,你保存的文件没有问题,就OK,不用在乎!
这种还是比较常见的,属于正常现象,就是访问目的地返回的信息有问题收到网络波动都会乱码,偶现的这种
你是用什么开发语言进行的,
首先命令行输入chcp查看系统默认编码格式
我电脑的默认编码格式就是cp936
运行配置中加上VM选项-Dfile.encoding="cp936"
就可以解决问题
cp936也可以换成GBK(cp936其实就是GBK)
1.pagesource得到的结果是源代码字符串;
2.用字符串设置编码utf8读取即可。
这和保存文本编码有关,浏览器自带解析编码,所以浏览器没有问题,可以尝试保存UTT-8形式再打开看看