import pandas as pd
pd.set_option('display.max_rows', None)
data = pd.read_excel(r'C:\Users\86135\Desktop\附件2销售流水明细.xlsx', usecols=['销售日期','扫码销售时间','销量(千克)','销售单价(元/千克)'])
print(data)
这个excel表格里面有八十万组数据,请问如何对数据进行预处理?还有我如何能够读取我需要的数据,我上面的代码电脑运行不了,notebook运行被限制了,已经更改过notobook的运行限制程度了,还是无法将数据完全处理。请各位帮忙解答谢谢!
分析思路:
预处理的第一个步骤就是筛选必要的信息,并另存为 temp.xlsx, 再去看这个temp.xlsx文件大小是不是小了很多..
第五行代码可以修改为
data.to_excel(r'C:\Users\86135\Desktop\temp.xlsx')
你用的是哪个版本的
【相关推荐】