用python实现,找出两张表格中指定列中的差异值,并按照表3的格式输出

问题遇到的现象和发生背景 :有两张表格,以其中sid列作为关联字段,匹配相同字段的列内容是否一致,不一致的数据按照表3的格式输出,
没有很好的思路。
以sid字段关联两张表,找到对应列不同的地方,并输出为表3格式。列比较多,有1786列。要求按照每列输出一张表格。

img

img

img

基本的实现方法参考如下代码:

import pandas as pd
df1=pd.read_csv('t03071.csv').drop(columns='coun').set_index('sid')
df2=pd.read_csv('t03072.csv').drop(columns='scode').set_index('sid')
for c in df1.columns:
    df=pd.concat([df1[c],df2[c]],axis=1)
    df.columns=['old_'+c,'new_'+c]
    df['diff']=df[df.columns[0]]-df[df.columns[1]]
    df=df[~(df['diff']==0)]
    df.to_csv(c+'.csv')

如对你有帮助或启发,请点采纳按钮。

您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632