Python识别图片或PDF页面的问题

最近遇到一个自动化办公方面的问题请教各位懂技术的朋友：
本人供职于一家检测技术企业，负责部门内的报告打印。报告是同事在电脑上编辑完后保存的PDF文件。我希望通过对PDF进行批量处理后再批量打印。
现在的情况是，由于业务领域和模板不同，PDF报告格式也不太一样，所以批量自动化处理有些困难。具体来说，有些PDF有彩色照片需要单独彩色打印，有些PDF带有一页占位用的封面页和一页空白签字页需要排除不打印。
现在的需求是：
1.能否用Python第三方库能够识别PDF或者图片中的彩色图片？
2.能否用Python第三方库能够按照某种模式识别不打印的封面页和空白签字页？
我现在掌握了将PDF转为图片的方法，也会处理PDF文件。如果有Python库能按照某种模式（指的是根据例如排版特点和页面上的信息）识别不打印的封面页的图片和空白签字页的图片，以及彩色图片也可以。

谢谢各位朋友！

补充一下：现在已经做到的是可以把PDF的每一张内容页拆分成一张图片，需要解决的就是：
1）按照指定的模式识别这些图片中不打印的封面页和空白签字页（模式说的是这两种页面/图片的内容有特定格式，希望能按照指定内容的格式把这两种页面识别出来）；
2）识别这些图片中的彩色图片

可以，使用一些ocr库，https://blog.csdn.net/qq_38017966/article/details/118724459

请看👉 ：python 识别读取pdf中的表格数据
您还可以看一下 nan老师的用Python处理PDF文件课程中的 PDF文件页面的旋转小节, 巩固相关知识点