怎样用pandas.read_excel遍历文件夹中所有的Excel表及表内数据

pandad

怎样用pandas.read_excel遍历文件夹中所有的Excel表及表内数据

你可以使用Python内置的os和glob库来遍历整个文件夹,并使用pandas.read_excel函数来读取Excel文件中的表,然后将它们存储在一个字典或列表中。下面是示例代码:

import os
import glob
import pandas as pd

# 需要读取的文件夹路径
folder_path = 'path/to/folder'

# 遍历文件夹中的所有 Excel 文件
excel_files = glob.glob(os.path.join(folder_path, '*.xlsx'))

# 创建一个空字典用于存储表数据
excel_data = {}

# 遍历所有 Excel 文件并将表数据存储在字典中
for file in excel_files:
    # 获取文件名作为字典键
    file_name = os.path.basename(file)
    # 使用 pandas 读取 Excel 中的表
    df = pd.read_excel(file)
    # 将表数据存储在字典中
    excel_data[file_name] = df

# 打印字典中的表数据
print(excel_data)

这里是一个简单的代码示例,适用于只有一个工作簿或文档的情况。如果你需要读取多个工作簿或文档,则为每个文件创建一个不同的数据框。在这种情况下,你需要修改代码来为每个 Excel 文件创建一个新的 excel_data 字典,或者按照你的便利选择一个列表之类的数据结构来存储表。

不知道你这个问题是否已经解决, 如果还没有解决的话:

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^