python爬虫下来的数据,如何把industry那一列乱七八糟的符号去掉?

img

爬虫下来的数据,如何把industry那一列乱七八糟的符号去掉?只保留最左边的名称文字。两边的中括号,引号,/,| 都要去掉

每一个都是列表取出第一个元素,然后按反斜杠切割,把最后一个去除掉,最后把剩余的replace就行

lis = [["工具类产品/c轮/500-2000人"],["其他/c轮/500-2000人"],["软件服务|资讯/c轮/500-2000人"]]
for li in lis:
    li = li[0].split("/")
    str = li[0]
    newStr = str.replace("|"," ")
    print(newStr)

img

有帮助的话记得采纳一下哦!