python读入Word文档错误

img


我原来以为是我文档格式打错了(文件是doc,我写的是docx),但是我改了之后还是不行。又新建了一个docx文件,同样的错误。然后不用绝对路径了还是一样。重装了python-docx还是一样报错……Python新手,大佬求解ww

试一试这行代码

from docx import Document

doc = Document('demo.docx')

#每一段的内容
for para in doc.paragraphs:
    print(para.text)

#每一段的编号、内容
for i in range(len(doc.paragraphs)):
    print(str(i),  doc.paragraphs[i].text)

#表格
tbs = doc.tables
for tb in tbs:
    #行
    for row in tb.rows:    
        #列    
        for cell in row.cells:
            print(cell.text)
            #也可以用下面方法
            '''text = ''
            for p in cell.paragraphs:
                text += p.text
            print(text)'''

在python中,python-docx库用于新建或更新docx文档,原文件是doc格式,只将其后缀改了一下,并不是docx格式文件,所以报找不到包的错误。解决思路是:读取docx格式文件,对于doc格式,使用转换工具转换成docx,再去读取操作。
详细参考:
https://blog.csdn.net/weixin_39643135/article/details/91348983