Python如何在对书的图片文字识别后自动返回页数

在文字识别过程中,我识别完成多张书的图片,希望通过查找关键字来找到对应在第几页。例如:10张图片分别对应书中1到10页。经过文字识别生成了txt文件,关键字“项目”在第九页。我想搜索关键字“项目”,然后可以返回页码“9”如何实现呢?
最好用Python3+
百度智能云文字识别
pycharm
难点是无法找到本页页数,同时难以判断它是否是页数。而且,实际应用过程中页码不会有顺序,所以得用图片上的页码,但页码难以识别出来。目前思路是:用图片识别后,用区域识别出页码,然后搜索关键字后,返回对应页码。想问具体如何实现或有更好思路吗

可以借助os模块用字符串判断方式来获取结果,参考代码:

import os 

for i,fn in enumerate(os.listdir('txts')):
    with open(os.path.join(os.getcwd(),'txts',fn),'r',encoding='utf-8') as f:
        if '项目' in f.read():
            print(i+1)

分别把每页识别结果存到一个变量中,然后遍历查找

用re惰性读取你得到的文档对应的页码那里,在单独存入列表或者字典就可以了,有用的话点一下采纳