在终端用tesseract时,检测了一下效果对图片识别,找不到生成文档。桌面和文件夹都看了没找到。看这个结果是,应该生成了文档的。
回答整理自chatgpt,如果解答了麻烦采纳一些,谢谢啦
当您在终端中使用Tesseract进行OCR时,识别结果通常会被保存在当前工作目录中的文本文件中。如果您没有指定输出文件名,则默认输出文件名为"stdout.txt"。
要确定Tesseract是否已经生成了识别结果文件,您可以尝试以下步骤:
确认当前工作目录:在终端中输入"pwd"命令,可以查看当前所在的工作目录。检查一下这个目录是否包含名为"stdout.txt"的文件。
检查输出文件名:如果您在使用Tesseract时使用了"-c tessedit_create_txt=1"参数或"-o"参数指定了输出文件名,则输出文件应该被保存在指定的文件名中。您可以尝试使用"ls"命令来列出当前目录下的所有文件,看是否有您指定的输出文件名。
检查Tesseract命令的完整性:检查您在终端中使用的Tesseract命令是否正确。如果命令格式不正确,Tesseract可能不会生成任何识别结果文件。
针对该问题,可以考虑以下解决方案:
import pytesseract
from PIL import Image
path = "./image.png"
output_path = "./result.txt" # 指定输出路径和文件名
testdata_dir_config = '--tessdata-dir "D:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
textCode = pytesseract.image_to_string(
Image.open(path),
config=testdata_dir_config,
lang='chi_sim'
)
with open(output_path, 'w', encoding='utf-8') as f:
f.write(textCode)
find / -name "generated_file_name*"
如果以上方案均不奏效,可以考虑在相关社区或论坛提问并寻求帮助,或者寻求其他资深IT专家的意见和建议。