pandas实现按条件连接两个dataframe,具体条件见内容

excel1:

excel2:

输出新的dataframe(excel3):

具体连接:按照A值将exce1和excel2两表连接成一个新表excel3, 连接条件为excel1表中“告警开始时间”与excel2表中“停电时间”最接近的值对应的行相连接,放在excel1生成新表excel3,是否可用apply和merge函数实现,具体代码求助

试下这样看是否可以:

1 先用A字段将两个表合并

2 然后计算 告警开始时间和停电时间的时间差 

3 时间差字段根据你的条件筛选(可根据是否必须停电时间在告警开始时间后面进行筛选 , 如果不考虑的话, 只看时间差的绝对值即可)

4 最后先排序分组后, 筛选第1条记录

import pandas as pd
import numpy as np

data1 = pd.read_excel('c:/users/yyz/desktop/123.xlsx',sheet_name='Sheet1')
data2 = pd.read_excel('c:/users/yyz/desktop/123.xlsx',sheet_name='Sheet2')

data3 = pd.merge(data1,data2,on='A',how='left')
data3['时间差'] = abs(data3['告警开始时间']-data3['停电时间'])

result1 = data3.sort_values(by='时间差').groupby(['告警开始时间','A']).first()

result2 = result1.drop('时间差',axis=1)

 

您好,我是问答小助手,你的问题已经有小伙伴为您解答了问题,您看下是否解决了您的问题,可以追评进行沟通哦~

如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~

ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632