如何爬取pdf文档呢?

最近在练习爬虫,爬取过程中遇到了PDF的文档,发现这种类型的文档它是分开的,不是一个整体。它的文字性内容在一个包里,图片,表格类的则在网页代码里放着。这种情况下,请问该怎么将它们爬取下来,并达到可以阅读的效果呢?
希望各位师傅能给个思路。

神仙来了也不行