我有许多个txt文件,因此无法一一转存,只能用python批量读取。
用notepad++发现编码格式是ANSI,找了许多的方法都无法解决。我将一个文件上传了,请帮忙看下如何读取!
python3
pd.read_table(path,encoding = 'gb18030')
你的文件第有多个B0字节,不管用GB18030还是UTF-8都没法解码,所以我能做的仅仅是忽略这个解码错误,在open函数中加上参数error="ignore".
with open("1.txt", encoding="utf-8",errors="ignore") as f:
print(f.read())
文件:http://pan.baidu.com/s/1mh5u8AW
代码首行添加
# -*- coding: GBK -*-