在学习Tesseract时遇到的难题,向前辈需求帮助!

首先在电脑上安装了tesseract-ocr-w64-setup-v5.0.0-alpha.20190623版本的tesseract,参照我们站点的指导,添加了中英日韩语言包,并配置了环境,具体情况如图所示:

img


配置好了环境变量

img


并添加了系统变量

在安装完一切之后,运行了CMD,检测tesseract是否安装成功,显示如下:

img


理应是已经安装成功的状态。因此我写了一小段程序,想尝试将图片中的文字转换成中文,具体代码如下图所示:

img


但是运行之后,显示如下图所示的错误:

img


通过百度搜索,修改了pytesseract.py源码中的内容
将tesseract_cmd = ’tesseract‘ 改成了 tesseract_cmd = r'C:/Program Files/Tesseract-OCR/tesseract.exe'(安装路径),但是仍然显示下图的错误:

img


因此想请教一下,应该怎么处理这个错误?非常感谢!

给你提供两种解决办法,可以试试看能否解决问题:
1.在系统环境变量中,新建一个名为tesseract,值为:C:/Program Files/Tesseract-OCR/tesseract.exe的变量。
2.修改源文件,在pytesseract库中找到pytesseract.py,将这行tesseract_cmd = 'tesseract'修改为:tesseract_cmd = 'C:/Program Files/Tesseract-OCR/tesseract.exe'
希望对你有用,如有用请点击采纳。