原Excel表格数据:
ID item
01 a
01 b
01 c
01 d
02 D
02 A
02 B
02 C
按照item出现的顺序转换成如下格式:
ID itemsequence
01 abcd
02 DABC
df.groupby(by='Id').item.sum() 使用sum方法直接求和就可以了
这种的话 我会从原表中提取出需要的数据,然后再生成新表。
import pandas as pd
df = pd.read_excel(r'新建 XLS 工作表.xls')
df1 = list(df[df['ID']==1]['item'])
df2 = list(df[df['ID']==2]['item'])
df_new = pd.DataFrame([[1,df1],
[2,df2]],columns=['ID','itemsequence'])
print(df_new)