使用Python分析纽约出租车搭乘数据

  1. 数据集基本信息:

地址:https://github.com/iconsider/nyc-taxi

时间:2009年至2018年

内容:出租车乘车信息,主要有乘车时间、位置、人数、费用等信息。

完整数据集大小:267GB

至少选择其中一年的数据进行分析,绘制以下分析结果:

  1. 按一天中的时间(00:00~24:00)绘制通行耗时的分时图
  2. 按乘车地点,绘制乘车费用的热力图

本人选择的是2016年的green taxi

 总共有21列,每列的数据如下(截取了一月的前几行数据,其中标记的列应该是实现需求所需要的列)

 在读取文件时出现了问题,可能是由于文件行数太多(1月就有一百多万行)

出错信息如下:

希望大佬指导一下 数据读取(可以只读取需要的列),最好可以指导一下如何完成需求,时间有点赶,得今晚之前,跪谢!

pandas读取数据