pandas处理csv筛选数据

问题遇到的现象和发生背景

一个5万条左右的数据(csv),数据表现形式如下:

trip_start_timetrip_end_timetrip duration
2022/6/16 16:45:012022/6/16 21:48:305:03:29
2021/8/28 0:23:152022/6/12 19:01:576930:38:42

数据是一个关于旅行时间的记录,有开始时间(trip_start_time),结束时间(trip_end_time)和实际旅程时长(trip duration),其中,实际旅程时长 = 结束时间 - 开始时间,现在只要实际旅程时长在10分钟到5小时的,其他全部视为异常值舍弃。

问题相关代码,请勿粘贴截图

import pandas as pd
df = pd.read_csv('seat_data_utf_8.csv')
df = df.loc[(df['trip duration'] >= '00:10:00') & (df['trip duration'] <= '05:00:00')]

运行结果及报错内容

运行结果显示0 rows * 23 columns,没有符合的条件行,但实际上是有的

我想要达到的结果

筛选出实际旅程在10分钟到5小时的代码

首先你要明确trip duration这一列是什么类型,然后根据类型去做比较

img


现在的类型比较乱,建议转换成时间戳去比较

你可以参考下这篇文章:Pandas 处理 `csv` 数据类型问题您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632