任务如标题所示发现将PDF文件转换为word文档后无法实现该功能,用什么库比较好,该如何处理呢?十分感谢。
为何要将pdf转化为word了。电子发票如果是固定格式的,用python带的那个库pdfminer一般就可以了。如果格式不一样会比较难整,得自己按照特定格式去解析位置,提取金额。推荐直接调百度的OCR接口,常规格式的发票用它一键搞定,如果量不大,用它的免费版就行了