有没有可以做这个python程序，还有一个相关的课程报告，可加钱

可做程序，但不想写报告麻烦

word或wps转换的文本型pdf，请参阅：

我必须把整个pdf文件转换成文本。我在很多地方见过把pdf转换成文本，但有特殊的页面。在

 from PyPDF2 import PdfFileReader    import os    def text_extractor(path):        w
      
      
        
          https://www.cnpython.com/qa/422552

图片型的pdf需要ocr识别，请参阅：

Python实现PDF转换文本详解_python_脚本中心 - 编程客栈目录一、前言1.1、为什么不使用传统的pdf转文本工具呢？二、实现过程2.1、基于深度学习的OCR将pdf为文本2.1.1、将pdf转换为图像2.1.2、检测和识别图像中的文本2.1.3... http://www.cppcns.com/jiaoben/python/429177.html

pip install pdfminer.six，然后执行以下代码，就可以将pdf文件转化为txt文件

from pdfminer.pdfinterp import PDFPageInterpreter,PDFResourceManager
from pdfminer.converter import TextConverter,PDFPageAggregator
from pdfminer.layout import LAParams
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfdevice import PDFDevice
from pdfminer.pdfpage import PDFPage

# 获取pdf文档
fp = open('exam.pdf','rb')

# 创建一个与文档相关的解释器
parser = PDFParser(fp)

# pdf文档的对象，与解释器连接起来
doc = PDFDocument(parser=parser)
parser.set_document(doc=doc)

# 如果是加密pdf，则输入密码
# doc._initialize_password()

# 创建pdf资源管理器
resource = PDFResourceManager()

# 参数分析器
laparam=LAParams()

# 创建一个聚合器
device = PDFPageAggregator(resource,laparams=laparam)

# 创建pdf页面解释器
interpreter = PDFPageInterpreter(resource,device)

# 获取页面的集合
for page in PDFPage.get_pages(fp):
    # 使用页面解释器来读取
    interpreter.process_page(page)
    
    # 使用聚合器来获取内容
    layout = device.get_result()
    for out in layout:
        if hasattr(out,'get_text'):
            print(out.get_text())
            
            # 写入txt文件
            fw = open('exam.txt','a')
            fw.write(out.get_text())

解决方法

需要的功能代码如下：

import pdfplumber
import codecs

input_file = "01.pdf"
output_file = "01.txt"
with pdfplumber.open(input_file) as pdf:
    for page in pdf.pages:
        f1 = codecs.open(output_file, 'a', 'utf-8')
        f1.write(page.extract_text())
        f1.close()

关于课程报告的话，可以讨论下看具体怎么个情况

如有问题及时沟通

这个就是个简单的练习题目，这个题目主要是要界面操作的吧。可以写