两个文件的uid相同,a文件序列是正确的,b文件按照a文件的顺序来排列,该文件大约6M,最后生成一个排列好的新文件,应该怎么做?
你按照排序方式生成文件就行了,我的理解是两个文件读写操作
找出a,b文件中共同字段,正常排序的a文件中某个序列应该是顺序排列的,这样对b文件按其顺序调整即可。类似于这样:
import pandas as pd
# df1=pd.read_csv('10291.csv').set_index('uuid')
# df2=pd.read_csv('10292.csv').set_index('uuid')
df1=pd.DataFrame({'uid':['n1','n2','n3'],'value':[123,456,789]}).set_index('uid')#正常排序
df2=pd.DataFrame({'uid':['n2','n3','n1'],'value':[456,789,123]}).set_index('uid')#非正常排序
print(df2.sort_index().reset_index())
df2.to_csv('10292.csv',index=False)
uid value
0 n1 123
1 n2 456
2 n3 789
如有帮助,请点采纳。