有没有可以做这个python程序,还有一个相关的课程报告,可加钱

有没有可以做这个python程序,还有一个相关的课程报告,可加钱

img

可做程序,但不想写报告麻烦

word或wps转换的文本型pdf,请参阅:

图片型的pdf需要ocr识别,请参阅:

pip install pdfminer.six,然后执行以下代码,就可以将pdf文件转化为txt文件

from pdfminer.pdfinterp import PDFPageInterpreter,PDFResourceManager
from pdfminer.converter import TextConverter,PDFPageAggregator
from pdfminer.layout import LAParams
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfdevice import PDFDevice
from pdfminer.pdfpage import PDFPage

# 获取pdf文档
fp = open('exam.pdf','rb')

# 创建一个与文档相关的解释器
parser = PDFParser(fp)

# pdf文档的对象,与解释器连接起来
doc = PDFDocument(parser=parser)
parser.set_document(doc=doc)

# 如果是加密pdf,则输入密码
# doc._initialize_password()

# 创建pdf资源管理器
resource = PDFResourceManager()

# 参数分析器
laparam=LAParams()

# 创建一个聚合器
device = PDFPageAggregator(resource,laparams=laparam)

# 创建pdf页面解释器
interpreter = PDFPageInterpreter(resource,device)

# 获取页面的集合
for page in PDFPage.get_pages(fp):
    # 使用页面解释器来读取
    interpreter.process_page(page)
    
    # 使用聚合器来获取内容
    layout = device.get_result()
    for out in layout:
        if hasattr(out,'get_text'):
            print(out.get_text())
            
            # 写入txt文件
            fw = open('exam.txt','a')
            fw.write(out.get_text())


解决方法

需要的功能代码如下:

import pdfplumber
import codecs

input_file = "01.pdf"
output_file = "01.txt"
with pdfplumber.open(input_file) as pdf:
    for page in pdf.pages:
        f1 = codecs.open(output_file, 'a', 'utf-8')
        f1.write(page.extract_text())
        f1.close()

关于课程报告的话,可以讨论下看具体怎么个情况


如有问题及时沟通

这个就是个简单的练习题目,这个题目主要是要界面操作的吧。可以写