pandas的一个小问题

像这样重复的数据怎么删除呢,求解

img

df.drop_duplicates()
参考:[https://blog.csdn.net/u010665216/article/details/78559091/]

望采纳

可以使用如下方法实现:

  1. 使用 str.split() 方法将 "电影类型" 列中的字符串拆分为单个类型值,这样每个类型就会单独成为一个列表中的元素。
  2. 使用 set() 构造函数将列表转换为集合。由于集合不允许有重复元素,所以这一步可以去除重复类型。
  3. 使用 str.join() 方法将集合中的每个元素拼接起来,并使用逗号作为分隔符。
new['电影类型'] = new['电影类型'].apply(lambda x: ','.join(set(x.split(','))))