PDF 表格读取,顺序错乱

我现在要读取PDF表格中的数据,尝试了python2.7 pdfminer \ python3 pdfminer3k \java pdfbox 等多种方案。但是结果都不理想,读取出的文本顺序都是乱的,请大师帮忙,指点一二

你想要把pdf文件中的表格读成啥样的?

在acrobat professional里面用页面功能可以随意调正页面的顺序,你自己拖动一下即可

修复你的PDF软件或者调整页面顺序。

直接用自带的view插件