批量读取PDF格式的电子发票后将内容与金额提取至Excel表格后求和计算

任务如标题所示
发现将PDF文件转换为word文档后无法实现该功能,用什么库比较好,该如何处理呢?
十分感谢。

为何要将pdf转化为word了。电子发票如果是固定格式的,用python带的那个库pdfminer一般就可以了。如果格式不一样会比较难整,得自己按照特定格式去解析位置,提取金额。推荐直接调百度的OCR接口,常规格式的发票用它一键搞定,如果量不大,用它的免费版就行了