Python dataframe一列去重

有一个dataframe,其中一列为:

index
AB102; AS129; ASKX
ASKX
……
AS129; A8SZ
AS129

我想先用“; ”分割出每个字符,然后再提取所有出现过的值(去重),也就是:
[AB102, AS129, ASKX, A8SZ]

可以用set去重,然后再转成list:

s = set()
for string in df['index']:
    for sub in string.split('; '):
        s.add(sub)
# l = list(s)

使用pandas的drop_duplicates()方法import pandas as pddf = pd.DataFrame({'A':[1,2,3,3,4,5]})df.drop_duplicates(subset='A', keep='first', inplace=True)print(df)

不知道你这个问题是否已经解决, 如果还没有解决的话:

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^