请问如何用Python提取PDF文本的多级标题?有合适的库吗?PythonMiner有没有这个功能呢?
https://blog.scraperwiki.com/2013/07/pdftables-a-python-library-for-getting-tables-out-of-pdf-files/
PDFMiner可以做到,但是前提是pdf中有书签和大纲,否则就要自己判断哪些文字是标题了。