Python如何爬取PDF文档呢？

我想请问一下，如何爬取PDF形式的文档内容呢？对于PDF里的文字内容倒是问题不大，但是PDF文档里含有图片或者表格的时候，他们是分开的。即使把他们爬取下来，也会因为排版问题无法保证可读性。
只是文档在网页的形式：

这个是单独爬取下来的图片：

请问遇到这种情况该怎么解决呢？