区别还是比较大的,自学的时候,一直以为pandas将list和自己的数据类型DataFrame等同化了,现在感觉不止cut一个函数,加不加list有区别,有高手解答一下本质区别吗?让人在知道目的时候,就能想清楚,该不该加list,大一新生,谢谢大佬关心
np.random.seed(0)
data=pd.DataFrame(np.random.randint(0,100,(450,2)),columns=["成绩","age"])
data_cut=pd.cut(data["成绩"],[0,60,70,80,90,100],right=False)
print(data_cut.describe())
输出:
count 450
unique 5
top [0, 60)
freq 278
Name: 成绩, dtype: object
改成list(data["成绩"])后
np.random.seed(0)
data=pd.DataFrame(np.random.randint(0,100,(450,2)),columns=["成绩","age"])
data_cut=pd.cut(list(data["成绩"]),[0,60,70,80,90,100],right=False)
print(data_cut.describe())
输出:
counts freqs
categories
[0, 60) 278 0.617778
[60, 70) 42 0.093333
[70, 80) 43 0.095556
[80, 90) 50 0.111111
[90, 100) 37 0.082222
传入DateFrame里的cut运行在DateFrame里,list的cut运行在list里