python怎么删除Excel中一列中的重复项,并且删除重复项后删除空白行
使用语句df=df[~df.a.duplicated()],或者df=df.drop_duplicates(subset='a'),可以解决所述问题,参考如下代码:
import pandas as pd
df=pd.DataFrame({'a':[5,2,3,5,7,2,3],'b':[0,1,2,3,4,5,6]})
df=df[~df.a.duplicated()].reset_index(drop=True)#对于有重复项的会保留先出现的项,后面重复项被删除,写入新表格中不再存在。
print(df)
df.to_excel('new1.xlsx',index=False)
运行结果:
a b
0 5 0
1 2 1
2 3 2
3 7 4
如果解答对你有帮助,请点击我回答的右上方采纳按钮给予采纳。
这个你得取出整个框架,再取出某一列,生成列表,判断重复项对应的行数,然后将框架中相应行删除,完事以后再to_excel,加到新的表格中。