pandas读取xlsx格式excel问题

从系统导出的.xlsx 电子表,用pandas读取,第一行因为是中文,显示不了乱码,我查了这个xlsx的编码是gb2312(点excel另存为然后选web然后看编码格式查到的),改成pd.read_excel(path1, encoding='gb2312')也是第一行不显示中文;但是如果把这个电子表改成.csv或者.xls格式都能正常读取第一行的中文。求大神指导下怎么在xlsx格式下用pandas读出第一行的中文

你怎么得知是gb2312的?你可以试试看别的编码,比如utf8

  1. 建议使用xlrd,这个很简单,我使用的是这个
  2. 如果要使用pandas,df.to_csv('changed.csv', header=None, index=None, encoding='utf_8_sig')
  3. 或者在开头的时候添加 sys.setdefaultencoding("utf-8")

希望对你有帮助

import pandas as 
pd res_file = pd.read_excel(path, hearder=0) 
print([k for k, v in res_file.items()])