试一试这行代码
from docx import Document
doc = Document('demo.docx')
#每一段的内容
for para in doc.paragraphs:
print(para.text)
#每一段的编号、内容
for i in range(len(doc.paragraphs)):
print(str(i), doc.paragraphs[i].text)
#表格
tbs = doc.tables
for tb in tbs:
#行
for row in tb.rows:
#列
for cell in row.cells:
print(cell.text)
#也可以用下面方法
'''text = ''
for p in cell.paragraphs:
text += p.text
print(text)'''
在python中,python-docx库用于新建或更新docx文档,原文件是doc格式,只将其后缀改了一下,并不是docx格式文件,所以报找不到包的错误。解决思路是:读取docx格式文件,对于doc格式,使用转换工具转换成docx,再去读取操作。
详细参考:
https://blog.csdn.net/weixin_39643135/article/details/91348983