Python识别图片或PDF页面的问题

最近遇到一个自动化办公方面的问题请教各位懂技术的朋友:
本人供职于一家检测技术企业,负责部门内的报告打印。报告是同事在电脑上编辑完后保存的PDF文件。我希望通过对PDF进行批量处理后再批量打印。
现在的情况是,由于业务领域和模板不同,PDF报告格式也不太一样,所以批量自动化处理有些困难。具体来说,有些PDF有彩色照片需要单独彩色打印,有些PDF带有一页占位用的封面页和一页空白签字页需要排除不打印。
现在的需求是:
1.能否用Python第三方库能够识别PDF或者图片中的彩色图片?
2.能否用Python第三方库能够按照某种模式识别不打印的封面页和空白签字页?
我现在掌握了将PDF转为图片的方法,也会处理PDF文件。如果有Python库能按照某种模式(指的是根据例如排版特点和页面上的信息)识别不打印的封面页的图片和空白签字页的图片,以及彩色图片也可以。

谢谢各位朋友!

补充一下:现在已经做到的是可以把PDF的每一张内容页拆分成一张图片,需要解决的就是:
1)按照指定的模式识别这些图片中不打印的封面页和空白签字页(模式说的是这两种页面/图片的内容有特定格式,希望能按照指定内容的格式把这两种页面识别出来);
2)识别这些图片中的彩色图片

可以,使用一些ocr库,https://blog.csdn.net/qq_38017966/article/details/118724459