python有没有库可以在软件界面找到对应文字?

目前,鼠标移动复制黏贴之类,我已经了解一点了。

但现在比如要从软件界面显示的几行中,找到我需要的公司名的所在行任意位置,“双击”进入填备注。 

双击之后我都会操作。就是计算机怎么知道我要找的公司名在当前显示界面中的大致位置【高度】呢?应该不是一个个双击每一行判断试错吧

界面中还有其他公司名,是图像识别文字?然后再获取具体位置嘛?

刚接触python,没有思路,所以问问有没有什么库可以推荐的,谢谢。

可以试一下paddlepaddle下的paddleocr,使用CUDA和cudnn时速度大概三秒,而且带坐标
先截屏,然后识别,筛选,最后点击编辑
如果要时刻检测的话会导致内存不够,所以建议手动控制

连接:https://github.com/PaddlePaddle/PaddleOCR (github)
https://www.paddlepaddle.org.cn/hub/scene/ocr (示例)