有这样一些表格,我想首先的内容为:如果前两列完全相同,则第三列数据相加,也就是合并相同项
df=pd.DataFrame({'a':[1,2,3,1],'b':[1,3,5,1],'c':[2,4,6,1]})
df=df.groupby(['a','b']).sum().reset_index()
print(df)
给你个思路
读取文件,用dict存储数据,比如说{[120,165]:1; [120,185]: 3}
遍历存储,如果key相同就value相加
遍历结束之后写入文件
import pandas as pd
df = pd.read_csv("./demo.csv", names=["c1", "c2", "c3"], sep=" ")
df = df.groupby(["c1", "c2"]).agg({"c3": "sum"}).reset_index()
print(df)