购买了一个英语题集,题目数量很多,是电子版docx格式,但是每一题下面都有译文和答案,希望批量删除
import docx
import os
from docx import Document
file=docx.Document("C://Users//苏江婉//Desktop//学习//学科//英语//ABC.docx")
def delWordContent(docx_file='',dest_file=''):
doc=Document(docx_file)
paragraphs=doc.paragraphs
def delete_paragraph(paragraph):
p = paragraph._element
p.getparent().remove(p)
paragraph._p = paragraph._element = None
if text.startswith("[答案]") is True:
delete.paragraph(p)
doc.save(dest_file)
delWordContent(docx_file='C://Users//苏江婉//Desktop//学习//学科//英语//ABC.docx',dest_file='C://Users//苏江婉//Desktop//学习//学科//英语//ABC[已完成].docx')
查看文件属性,它没有保存,循环中有错误,但是没有报错
调用了python-docx,通过关键词定位进而删除段落
通过关键词定位进而删除段落
路径错误
/不是转义符,不要连写两个,\才是转义符
另,哪有循环呀,我怎么没看到