首页
编程
java
php
前端
首页
编程
java
php
前端
怎么使用python提取pdf三线表?
三线表不像表格一样提取出来在Excel上值对应不上,怎么处理?
参考一下:
关于Python使用Camelot库优化提取PDF三线表的技巧,解决识别的表字段名错位,过多的空白单元的问题_New_joined_lion的博客-CSDN博客
关于Python使用Camelot库优化提取PDF三线表的技巧:解决识别的表字段名错位,过多的空白单元的问题问题描述测试文件原始代码原始提取效果原因分析解决方案针对表字段错位针对空白单元最终实现代码最终效果参考文章:camelot官方文档问题描述测试文件使用的待测试的提取PDF文件: Table 1原始代码tables = camelot.read_pdf(path, pages=str(pageID), flavor="stream", table_areas=[area])原始提
https://blog.csdn.net/New_joined_lion/article/details/107190845
点击展开全文