python数据处理

请问如何利用python将excel表中的的重复数据提取出来?

不是去重,去重是得到唯一值,我现在想知道的是表中有哪些数据是重复的,重复了多少次,不是True or False

用字典统计啊

li = ["aa","bb","cc","bb","aa","bb"]
dic = {}
for v in li:
    dic[v] = dic.get(v,0)+1
print(dic)

 

pandas.duplicated().count

第一步,去重,得到唯一值;

第二步,使用唯一值去把excel数据相同值找出来;

第三步,统计相同值的个数。

 

pandas里面的count