pandas read_excel读取excel表格返回下划线

pandas读取某些表格返回下划线,大部分能读取成功,个别会返回下划线,实际用WPS打开是有内容的

img

img

很奇怪,第一次遇到,不知各位是否有类似情况
这是该excel文件下载地址(把#删掉)
https://image.zh/#a#oj#i#ao.net/file/2023-04-11/18242516794b2.xls

不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 以下回答来自chatgpt:

    我可以使用 openpyxl 库来代替 pandas 的 read_excel 函数来读取该 Excel 文件,这样可以避免出现下划线的问题。

    首先需要安装 openpyxl 库,你可以使用以下命令来安装:

    !pip install openpyxl
    

    接下来可以使用 openpyxl 库中的 load_workbook 函数来读取 Excel 文件,具体的代码如下:

    from openpyxl import load_workbook
    
    # 读取 Excel 文件
    workbook = load_workbook(filename='https://personal-public-data.oss-cn-beijing.aliyuncs.com/testdata.xlsx'.replace('#', ''))
    # 选择需要读取的 Sheet
    sheet = workbook.active
    
    # 打印 Sheet 中的内容
    for row in sheet.iter_rows(min_row=1, max_col=5, values_only=True):
        print(row)
    

    其中 load_workbook 函数的 filename 参数需要将 # 替换成空字符串,因为使用 # 作为链接的一部分会被 URL 解析器视为锚点,可能会导致读取到的文件内容不对。

    代码中的 iter_rows 函数可以按行遍历 Sheet 中的内容,可以指定最小行号和最大列数以及 values_only=True 来获取单元格的实际值,这样可以避免读取到一些格式化的内容,比如公式。

    通过这种方式读取 Excel 文件,应该不会再出现下划线的问题了。


如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^