python怎么删除一列中的重复项,并且删除重复项后删除空白行

python怎么删除Excel中一列中的重复项,并且删除重复项后删除空白行

用pandas处理,参考一下: python 删除excel表格重复行,数据预处理操作 - 云+社区 - 腾讯云 以上这篇python 删除excel表格重复行,数据预处理操作就是小编分享给大家的全部内容了,希望能给大家一个参考。 https://cloud.tencent.com/developer/article/1725605

使用语句df=df[~df.a.duplicated()],或者df=df.drop_duplicates(subset='a'),可以解决所述问题,参考如下代码:

import pandas as pd 
df=pd.DataFrame({'a':[5,2,3,5,7,2,3],'b':[0,1,2,3,4,5,6]})
df=df[~df.a.duplicated()].reset_index(drop=True)#对于有重复项的会保留先出现的项,后面重复项被删除,写入新表格中不再存在。
print(df)
df.to_excel('new1.xlsx',index=False)

运行结果:

a  b
0  5  0
1  2  1
2  3  2
3  7  4

如果解答对你有帮助,请点击我回答的右上方采纳按钮给予采纳。

参考: 使用Python脚本删除Excel工作表中的重复项_culuo4781的博客-CSDN博客 In the article, Python scripts to format data in Microsoft Excel, we used Python scripts for creating an excel and do various data formatting. Python is an interesting high-level programming langu... https://blog.csdn.net/culuo4781/article/details/107627094

这个你得取出整个框架,再取出某一列,生成列表,判断重复项对应的行数,然后将框架中相应行删除,完事以后再to_excel,加到新的表格中。