关于数据清洗以及读取大批量数据的为问题


import pandas as pd
pd.set_option('display.max_rows', None)
data = pd.read_excel(r'C:\Users\86135\Desktop\附件2销售流水明细.xlsx', usecols=['销售日期','扫码销售时间','销量(千克)','销售单价(元/千克)'])
print(data)

这个excel表格里面有八十万组数据,请问如何对数据进行预处理?还有我如何能够读取我需要的数据,我上面的代码电脑运行不了,notebook运行被限制了,已经更改过notobook的运行限制程度了,还是无法将数据完全处理。请各位帮忙解答谢谢!

分析思路:
预处理的第一个步骤就是筛选必要的信息,并另存为 temp.xlsx, 再去看这个temp.xlsx文件大小是不是小了很多..
第五行代码可以修改为

data.to_excel(r'C:\Users\86135\Desktop\temp.xlsx')

你用的是哪个版本的

【相关推荐】




如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^