一个行数很多的txt文件 每一行有部分字符是gbk编码的 其它的是utf-8的 有什么方法可以把它的编码统一
试试用这个来判断编码
https://code.google.com/archive/p/juniversalchardet/
然后用new String(xxx.getBytes(转换前编码),转换后编码)
另存为,然后就可以选择编码了。
一部分是\uxxxx这样的 一部分又是gbk编码的是把。
思路就是如果有标识直接按行读取时,如果没有标识就自己按照对应的编码格式判断一下,然后转成string 然后 再重新写入新文件。