要如何用Pandas打开和处理超大的CSV文件?刚开始学遇到需要处理公交GPS数据的情况,一天的GPS数据就有7G。试了很多人发的读取所有的chunk块并将所有块拼接成一个DataFrame的方法,但是文件太大了还是会特别卡,最后报错。
可以参考如下2个资料:
csv格式读取大文件本身很慢,建议一次读取处理后存成pickle格式或者Parquet、Feature格式。