目的:想将相邻年份数据,IDind相同的数据(意思是该个体两个年份都有,其他的先不要)保留,生成的数据只有两个年份 个体相同的平衡数据。
年份包括:
例如 保留1989年和1991年IDind为111101012的数据。
if df_2021['WAVE'] == 1989 | df_2021['WAVE'] == 1991:
将筛选后df_2021保留成df_1991
elif df_2021['WAVE'] == 1991 | df_2021['WAVE'] == 1993:
将筛选后df_2021保留成df_1993
elif df_2021['WAVE'] == 1993 | df_2021['WAVE'] == 1997:
将筛选后df_2021保留成df_1997 以此类推
elif df_2021['WAVE'] == 1997 | df_2021['WAVE'] == 2000:
elif df_2021['WAVE'] == 2000 | df_2021['WAVE'] == 2004:
elif df_2021['WAVE'] == 2004 | df_2021['WAVE'] == 2006:
试下这段代码,可在此基础上完善, 思路:
import pandas as pd
import numpy as np
lis1 = [1989,1991,1993,1997,2000,2004]
lis2 = [1991,1993,1997,2000,2004,2006]
lis3 = [[i,j] for i ,j in zip(lis1,lis2)]
for i in lis3:
datai = data[data['WAVE'].isin(i)].groupby('IDind').filter(lambda x:len(x)==2)
datai.to_excel('df_'+ str(i[0]) +'.xlsx')
您好,我是有问必答小助手,你的问题已经有小伙伴为您解答了问题,您看下是否解决了您的问题,可以追评进行沟通哦~
如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~
ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>>https://vip.csdn.net/askvip?utm_source=1146287632
非常感谢您使用有问必答服务,为了后续更快速的帮您解决问题,现诚邀您参与有问必答体验反馈。您的建议将会运用到我们的产品优化中,希望能得到您的支持与协助!
速戳参与调研>>>https://t.csdnimg.cn/Kf0y
没有数据库吗?应该通过SQL语句筛选效率更好吧