我要将数据进行按照不同变量名分组
比如有a40,b23,c22,c123,
其实这是三个公司从c22和c123是同一个公司的不同名称
我就应该用groupby分三组,但是表格里有四个名称,直接用groupby就会是四组
我该怎么处理另个名字但其实代表一个意思的这种变量
可以这样操作:
import pandas as pd
df=pd.DataFrame({'name':['a40','b23','c22','c123'],'val':[100,110,120,130]})
a=df.groupby([x[0] for x in df['name']])['val'].sum()
print(a)
运行结果:
F:\2022>python -u "f:\2022\pythontest\t1.py"
a 100
b 110
c 250
Name: val, dtype: int64
如有帮助,请点采纳。
大概两种方式
1、把 c22 替换成 c123
2、另外建一个列,用于分组,先复制 分组列,再 把 c22 替换成 c123 。 这样不破坏原数据。
您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!