windows 中用BAT读取文本并在控制台显示出来,显示乱码。result.txt里面是中文。
@echo off
echo 正在执行,请稍后....
tesseract example1.tif result -l chi_sim
for /f "delims=" %%a in (result.txt) do (
echo %%a
)
@pause
http://jingyan.baidu.com/article/ce436649f44d4d3773afd302.html
如果是按 ASCII 字符一个个读出来显示,肯定是乱码:因为每次的输出,对于汉字来说只是半个汉字。
中文需要用unicode方式读取文件并获取字符串内容
控制台默认的是ascii码读取字符,而ascii不支持中文,所以是乱码。建议用文本编辑器另存为源文件更改编码格式,然后继续操作就好了。