PDF的文字定位识别

怎么对PDF内的文字分段识别？例如：第一张图是一个PDF，里面包含标题、作者、正文，我要用什么方法去分别把标题、作者、正文读取出来并写入excel？写入excel的格式如图二。求大神指导指导！！！！求求了！！！！！

内容很多么，这种要看你的实际情况。

如果是最后一种情况，这种没有什么万能的解决方案，你这是一个有技术含量，又有开发工作量的功能需求，需要花钱找人做开发。

借用pdfplumber库，挺好实现的。如果百度还解决不了问题，改天我再整理一篇博文