1、能够对jpg、png等图片格式OCR成双层pdf
2、输出双层pdf、txt文本;
3、最好Delphi实例或java实例
4、解决问题,现金酬谢
Tesseract-OCR生成双层的PDF文件好像有些问题,如果中英文混合,怎么去生成?
商业上可以用的纯ocr代码会比较贵,但是可以调用Office自带的那个,这个其实是清华紫光给微软贴牌的
Microsoft Office Document Imaging 11.0
https://blog.csdn.net/wo519074786/article/details/7732582
开源的目前最好的是Tesseract-OCR,你google下调用的例子很多,但是对中文识别不如清华紫光的好