如何爬取pdf文档呢？

最近在练习爬虫，爬取过程中遇到了PDF的文档，发现这种类型的文档它是分开的，不是一个整体。它的文字性内容在一个包里，图片，表格类的则在网页代码里放着。这种情况下，请问该怎么将它们爬取下来，并达到可以阅读的效果呢？
希望各位师傅能给个思路。

神仙来了也不行