目前我正在学习python 的pandas模块
我需要对一个时间戳类型的单列Dataframe做出处理,数据样例如下:
0 1477967229
1 1477998606
2 1477990864
3 1477991914
4 1477962567
5 1477976182
6 1477979702
7 1477993668
8 1477995583
9 1477991619
10 1477995005
数据量为一天,我想按照小时把这个Dataframe划分为24组,并且统计每一组中数据的数量,请问应该怎么编写代码呢。
急求 谢谢各位了
import pandas as pd
l = [1477967229, 1477998606, 1477990864, 1477991914, 1477962567, 1477976182, 1477979702, 1477993668, 1477995583, 1477991619, 1477995005]
pd.DataFrame({'time':l})
df["time"] = pd.to_datetime(df.time, unit='s')
df.groupby([df["time"].dt.hour]).size()
time
1 1
2 1
4 1
5 1
9 4
10 2
11 1
dtype: int64