Python如何爬取PDF文档呢?

我想请问一下,如何爬取PDF形式的文档内容呢?对于PDF里的文字内容倒是问题不大,但是PDF文档里含有图片或者表格的时候,他们是分开的。即使把他们爬取下来,也会因为排版问题无法保证可读性。
只是文档在网页的形式:

img

这个是单独爬取下来的图片:

img

请问遇到这种情况该怎么解决呢?