pandas dataframe某列中名称相同的两个值,其所在的行各列取平均值,但两行均保留。
就是如果某列有重复的值,那么该值所在的两行其他值取平均值,但两列都存在。
至少做个demo出来,更好理解。也免去了答主自己变数据。
df=pd.DataFrame({'a':[0,1,2,1,2],'b':[0,3,4,5,4],'c':[11,12,13,14,0]})
df=df.set_index('a')
df.update(df.groupby('a').mean())
df.reset_index(inplace=True)
print(df)