像这样重复的数据怎么删除呢,求解
df.drop_duplicates()
参考:[https://blog.csdn.net/u010665216/article/details/78559091/]
可以使用如下方法实现:
str.split()
方法将 "电影类型" 列中的字符串拆分为单个类型值,这样每个类型就会单独成为一个列表中的元素。set()
构造函数将列表转换为集合。由于集合不允许有重复元素,所以这一步可以去除重复类型。str.join()
方法将集合中的每个元素拼接起来,并使用逗号作为分隔符。new['电影类型'] = new['电影类型'].apply(lambda x: ','.join(set(x.split(','))))