地址:https://github.com/iconsider/nyc-taxi
时间:2009年至2018年
内容:出租车乘车信息,主要有乘车时间、位置、人数、费用等信息。
完整数据集大小:267GB
至少选择其中一年的数据进行分析,绘制以下分析结果:
本人选择的是2016年的green taxi
总共有21列,每列的数据如下(截取了一月的前几行数据,其中标记的列应该是实现需求所需要的列)
在读取文件时出现了问题,可能是由于文件行数太多(1月就有一百多万行)
出错信息如下:
希望大佬指导一下 数据读取(可以只读取需要的列),最好可以指导一下如何完成需求,时间有点赶,得今晚之前,跪谢!
pandas读取数据