用分割线切割数据就行了,示例如下:
假如想要去掉表中的‘#',‘;'而且以‘#'和‘;'为分割线切割数据:
#将dfxA_2的每一个分隔符之间的数据提出来
col1=dfxA_2['travel_seq'].str.split('#').str[0]
col2=dfxA_2['travel_seq'].str.split('#').str[1]
col3=dfxA_2['travel_seq'].str.split('#').str[2].str.split(';').str[0]
用正则表达式把需要的内容替换成空字符串即可
你题目的解答代码如下:
import re
import pandas as pd
df=pd.DataFrame({'data':[
'姓名:张三,身份证号(340111111111111038),电话号码(15911110701)',
'姓名:李四,身份证号(340222222222222238),电话号码(15322222207)',
'姓名:王五,身份证号(340333333333333238),电话号码(15444444405)'
]})
print(df)
df['data'] = df['data'].apply(lambda x: re.sub(r"[,,]电话号码.+?\)","",x))
print(df)
如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!