tesseract识别文字生成的结果文档在哪里呢

在终端用tesseract时,检测了一下效果对图片识别,找不到生成文档。桌面和文件夹都看了没找到。看这个结果是,应该生成了文档的。

img

回答整理自chatgpt,如果解答了麻烦采纳一些,谢谢啦
当您在终端中使用Tesseract进行OCR时,识别结果通常会被保存在当前工作目录中的文本文件中。如果您没有指定输出文件名,则默认输出文件名为"stdout.txt"。

要确定Tesseract是否已经生成了识别结果文件,您可以尝试以下步骤:

确认当前工作目录:在终端中输入"pwd"命令,可以查看当前所在的工作目录。检查一下这个目录是否包含名为"stdout.txt"的文件。

检查输出文件名:如果您在使用Tesseract时使用了"-c tessedit_create_txt=1"参数或"-o"参数指定了输出文件名,则输出文件应该被保存在指定的文件名中。您可以尝试使用"ls"命令来列出当前目录下的所有文件,看是否有您指定的输出文件名。

检查Tesseract命令的完整性:检查您在终端中使用的Tesseract命令是否正确。如果命令格式不正确,Tesseract可能不会生成任何识别结果文件。

  • 你可以看下这个问题的回答https://ask.csdn.net/questions/7515597
  • 以下回答由chatgpt基于相关博客总结生成:

    针对该问题,可以考虑以下解决方案:

    1. 检查代码中是否指定了生成文档的保存路径,例如在使用pytesseract时,可以通过指定输出文件名和路径来保存识别结果,代码示例:
    import pytesseract
    from PIL import Image
    
    path = "./image.png"
    output_path = "./result.txt" # 指定输出路径和文件名
    testdata_dir_config = '--tessdata-dir "D:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
    textCode = pytesseract.image_to_string(
        Image.open(path), 
        config=testdata_dir_config,
        lang='chi_sim'
    )
    with open(output_path, 'w', encoding='utf-8') as f:
        f.write(textCode)
    
    1. 如果没有指定保存路径,可以在终端或文件浏览器中进行搜索,例如在终端中使用以下命令进行搜索:
    find / -name "generated_file_name*"
    
    1. 如果仍然找不到生成的文档,可以检查代码中使用的库或工具是否存在问题,例如在使用tesseract-ocr时,可以尝试重新安装或更新该工具,并确保已按照要求配置好相关环境和语言包。

    如果以上方案均不奏效,可以考虑在相关社区或论坛提问并寻求帮助,或者寻求其他资深IT专家的意见和建议。