怎么把pdf的铁路网络图转换为可以单独识别线名、站名？

铁路结算站示意图长这个样子。

我有pdf格式的铁路结算站示意图，
①需要用某种工具把图的线段、红圈、黑圈、站名、线名、里程数隔离出来，成为单独可识别的标签（具备可检索能力）。

②要求达到输入始发站、终到站、经由线路，自动生成该路径。
例如：

【始发站】：阳平关
【终点站】：达州
【经由】：阳安线、襄渝线
生成：

要达到这种程度，请问问题①有什么好的工具推荐，问题②用什么技术可以实现？

该回答引用GPT
问题①中需要将结算站示意图中的元素（线段、圆圈、文字等）单独识别并生成标签，这需要使用OCR（Optical Character Recognition，光学字符识别）技术和图像处理技术。

OCR使用特定的技术和算法，将图像转化为文本，可以识别出站名、线名等文字信息，并生成标签。图像处理可以将图像中的线段、圆圈等元素提取出来，转化为矢量图形或其他可编程的格式。

业界常用的OCR工具包括Google的Tesseract、ABBYY的FineReader等；图像处理可使用MATLAB、Python等，也可以使用相关的开源工具包。

问题②中可以使用数据结构和算法中的最短路径算法来实现。最简单的最短路径算法是Dijkstra算法，也可以使用其他更复杂的算法，如A*算法等。实现的关键在于将站点和路线转化为图形和边，然后对其进行算法求解。实现时可以使用Python等编程语言，并使用相应的数据结构和算法库来实现。

需要视觉检索 OCR 这类的