表格扫描件的照片指定汉字识别和标注

目前有一些表格扫描件的照片(不是原图,是照片!),请问如何识别图片中的指定字段?
目前使用CV2的图像匹配功能,和pytesseract字体识别功能,效果均不佳。

img

您好,您可以尝试使用 Python 中的 OpenCV 和 Tesseract 这两个库来实现图片中字段的识别。OpenCV 可以用来实现图像处理,例如图像匹配、图像轮廓检测等,而 Tesseract 则可以用来实现文字识别。

首先,您可以使用 OpenCV 来检测图片中的轮廓,并获取字段的位置信息。然后,您可以使用 Tesseract 来识别图片中的文字,并将文字信息与轮廓信息结合起来,实现指定字段的识别