使用jupyter进行数据处理,
#对各专业、校园卡号的消费总额进行分组聚合
con_sum = all_data2.groupby(['专业','校园卡号','性别'])[['消费金额']].sum()
con_sum
能够正常得到结果
再对字段进行分箱
cut_data = pd.qcut(con_sum['消费金额'],q = 6)
cut_data
最后想使用pd.merge把分箱的结果连接到聚合后的后面,结果其他的字段就消失了,更换连接顺序和方法,也还是一样的。
con_sum1=pd.merge(con_sum,cut_data,on = '校园卡号',how='left')
con_sum1
是不是分箱或者聚合的数据不能连接? 跪求大佬指点问题在哪,或者更好的做法。
把con_sum,cut_data的索引变成列之后再合并。
con_sum.reset_index(inplace = True)
cut_data.reset_index(inplace = True)
con_sum1=pd.merge(con_sum,cut_data,on = '校园卡号',how='left')