Python dataframe一列去重

有一个dataframe，其中一列为:

我想先用“； ”分割出每个字符，然后再提取所有出现过的值（去重），也就是：
[AB102, AS129, ASKX, A8SZ]

可以用set去重，然后再转成list:

s = set()
for string in df['index']:
    for sub in string.split('; '):
        s.add(sub)
# l = list(s)

使用pandas的drop_duplicates()方法import pandas as pddf = pd.DataFrame({'A':[1,2,3,3,4,5]})df.drop_duplicates(subset='A', keep='first', inplace=True)print(df)

不知道你这个问题是否已经解决, 如果还没有解决的话:

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^