我需要用 Pandas 和 Openpyxl 做excel数据分析,但是有一部分 excel 文件是密码加密的,我知道密码,但是不知道怎么用Pandas 或 Openpyxl 读取这些加密的文件,
以下是 Openpyxl 写的,每次遇到加密的文件都会报错。但是我没找到密码类的参数。
import openpyxl
import pandas as pd
def read_pwd_excel(file: str):
wb = openpyxl.load_workbook(file, read_only=True, data_only=True, keep_vba=False)
sht = wb[wb.sheetnames[0]]
sht.reset_dimensions()
print(pd.DataFrame(sht.values))
wb.close()
ERROR:
raise BadZipFile("File is not a zip file")
zipfile.BadZipFile: File is not a zip file
python读取加密Excel可使用msoffcrypto库。具体参照:https://mp.weixin.qq.com/s?__biz=MzA3NTMzMjMyOA==&mid=2650929573&idx=1&sn=1128c35313d45acbf74a5db05dc381bb&chksm=84877622b3f0ff343bc2b6aeb7bdd02787275d07b0c8d7119e82823323177b6b649a00dd8236&scene=27
不知道你这个问题是否已经解决, 如果还没有解决的话:参数包括excel路径,sheet页面名称,其中df为DataFrame格式
`df = pd.read_excel(path_data,sheet_name=sheet_original)`