我爱占星网 我爱占星网
首页
编程
java
php
前端
首页 编程 java php 前端

Python或c#实现图片格式的PDF转txt

Python或C#有什么办法能比较好使将图片格式的pdf文件转为txt,同时需要能带格式的
地识别图片中的表格

可以分为2步,首先将图片提取出来,然后进行文字识别,至于表格,因为你是图片,所以只能转换成文本,然后再根据一定规则去还原
前者可以用pdfminer,后者文字识别可以用pytesseract

近期文章

  • 石头剪刀布的一道问题,找不到错误,请大神帮忙改到满分
  • 输入N*N的矩阵,输出它的转置矩阵?
  • Python列表切片-1开始,-1结束为什么能实现元素排序反转?
  • springboot启动加载Converter报错
  • 请问用JAVA空心三角形怎么写? 图如下。
  • java中,sub类继承自super类的成员变量赋值后,为什么输出this和super都是子类的该变量值
  • Python的一道练习题,求解
  • 合并数组值,交替
  • 我想主持yii应用程序
  • 什么是我的代码发生的事情
  • 替代着色的问题
  • 设置phpMyAdmin的密码
  • 通过wget / curl长时间的cron工作?
  • Android将数据发送到Php($ _SERVER)
  • 为什么这个Yii验证器不起作用?
  • 错误的时区MongoDate在PHP中
  • 如何结合这两个查询?
  • 格式化日期时遇到问题
  • 解析HTML几个表DOM [关闭]
  • 我们可以使用Flex合并2个视频吗?

Copyright ©2022 我爱占星 All Rights Reserved.

浙ICP备2022030071号-1

部分图文来自网络,如有侵犯您的版权,请告诉我们删除

友情链接:代码精华