import pandas as pd
import numpy as np
import os
#读取数据源
pr = pd.read_excel('E:\范国强\python\指派\预到达运单信息.xlsx',usecols=['运单号','收件地址'])
bz = pd.read_excel('E:\范国强\python\指派\地址库.xlsx',index_col=0)
pr['收件地址'] = pr['收件地址'].astype('string')
bz['地址'] = bz['地址'].astype('string')
#遍历,在‘收件地址’中找出包含B的数据,并写入名字为“指派”的excel文件
for B in bz['地址']:
A = pr[pr['收件地址'].str.contains(B)]
print(A)#看输出结果
A.to_excel('E:\范国强\python\指派\指派.xlsx',index = False)
A输出的结果,4组数据,后面两组是没有在收件地址找到匹配数据
最后输出文件的结果
问:为什么会最后一组数据把前面的数据覆盖了。怎么能把A的结果全部写入excle,并且空白数据组不显示(或不写入)?
代码中for 循环,每次给A赋值,循环结束后只保留最后一行结果。要将所有数据添加进去,需要构建一个空数据框,在循环中添加。
A=pd.DataFrame()
for B in bz['地址']:
A = A.append(pr[pr['收件地址'].str.contains(B)],ignore_index=True)
#print(A)#看输出结果
A.to_excel('E:\范国强\python\指派\指派.xlsx',index = False)
您好,我是问答小助手,你的问题已经有小伙伴为您解答了问题,您看下是否解决了您的问题,可以追评进行沟通哦~
如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~