Python或C#有什么办法能比较好使将图片格式的pdf文件转为txt,同时需要能带格式的地识别图片中的表格
可以分为2步,首先将图片提取出来,然后进行文字识别,至于表格,因为你是图片,所以只能转换成文本,然后再根据一定规则去还原前者可以用pdfminer,后者文字识别可以用pytesseract