各位大神,你们谁用过ORC的包?
我在网上找的一个是TESS4J,还有的就是Tesseract ORC.
哪个好一点
kao,还是日文的。这个需要ocr+翻译。
但是不太建议,因为你这个是医疗领域,ocr和翻译都有误差,又有那么多专业术语,两个叠加起来要出人命的。还是让人来解决吧。
你这个是要把日文的内容解析出来吗?
http://jingyan.baidu.com/article/ae97a64699f19dbbfc461d47.html
这个是如何解析图片中字体内容的,不知道日文的能不能转换,
但是如何用代码实现这个就是高难度的了,图像识别系统吧,另请大神吧
过程可以考虑
1) picture -> text
2) 日文文字识别
3) 日文信息转换中文信息
4) 中文 text -> picture
图片识别转换成文本技术可能需要自己找切合自己项目的
日文信息转换中文信息,应该是业务部分
文本在转图片