想查找.docx文件中的关键字,并且输出结果,代码如下:
from docx import Document
import os,sys
choice = input('''
请输入需要查找文件的位置:
1.2018年工作
2.2019年工作
3.2020年工作
4.2021年工作
5.桌面查找
''')
keyword = input('请输入需要查找的关键字:')
if choice == '1':
scripts_path = 'E:/2018养老中心/'
elif choice == '2':
scripts_path = 'E:/2019养老中心/'
elif choice == '3':
scripts_path = 'E:/2020养老中心/'
elif choice == '4':
scripts_path = 'E:/2021养老中心/'
elif choice == '5':
scripts_path = r'C:\Users\Lenovo\Desktop'
files_path_list = []
for root,dirs,files in os.walk(scripts_path):
if files:
for file in files:
if file.endswith(".docx"):
files_path_list.append(os.path.join(root,file).replace("\\","/"))
try:
for i in files_path_list:
document = Document(i)
for paragraph in document.paragraphs:
if keyword in paragraph.text:
print('找到了文件位置在:'+i)
except:
print('docx.opc.exceptions.PackageNotFoundError:')
现在的问题有两个:
1.总是提示:docx.opc.exceptions.PackageNotFoundError:Package not found at+文件名,不知道怎么处理,只能加一个try except
2.在以下代码:
for paragraph in document.paragraphs:
if keyword in paragraph.text:
print('找到了文件位置在:'+i)
这段代码中,输入的关键字在word中多次重复出现,于是输出的结果,就是出现几次输出几次结果
现在我需要解决的是
1.解决“docx.opc.exceptions.PackageNotFoundError:Package not found at+文件名”这个错误
2.关键词在word中多次出现,只输出一个结果
请各位老师、大神帮帮忙
对形如~xxx.docx的word文档临时文件无法读取报错问题及输出重复问题均可在代码中进行排除。
from docx import Document
import os,sys
choice = input('''
请输入需要查找文件的位置:
1.2018年工作
2.2019年工作
3.2020年工作
4.2021年工作
5.桌面查找
''')
keyword = input('请输入需要查找的关键字:')
if choice == '1':
scripts_path = 'E:/2018养老中心/'
elif choice == '2':
scripts_path = 'E:/2019养老中心/'
elif choice == '3':
scripts_path = 'E:/2020养老中心/'
elif choice == '4':
scripts_path = 'E:/2021养老中心/'
elif choice == '5':
scripts_path = r'C:\Users\Lenovo\Desktop'
src=[]
for root, dirs, files in os.walk(scripts_path):
for fn in files:
if fn.endswith(".docx") and not fn.startswith('~'):
f=os.path.join(root, fn).replace("\\", "/")
document = Document(f)
for paragraph in document.paragraphs:
if keyword in paragraph.text and f not in src:
print(f'关键字{keyword}在文件{f}找到')
src.append(f)
您好,我是问答小助手,你的问题已经有小伙伴为您解答了问题,您看下是否解决了您的问题。
如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~
你好,我是问答小助手,本次您提出的有问必答问题,已经由其他小伙伴为您做出解答,并解决了您的问题。
本次提问扣除的有问必答次数,已经为您补发到账户,我们后续会持续优化,扩大我们的服务范围,为您带来更好地服务。