提取指定字符串HLH或HLW前的数据(含该字符串)如下:
df['数据'] = ['我觉得和-HLH-1','我意思和他-HLW-16']
结果:
['我觉得和-HLH','我意思和他-HLW']
暂无
暂无
暂无
['我觉得和-HLH','我意思和他-HLW']
df=pd.DataFrame({'数据':['我觉得和-HLH-1','我意思和他-HLW-16']})
df['数据']=df['数据'].str.extract(r'(.*HL[H|W])')
print(df)
这个是整的列表还是dataframe数据?
给个例子参考:
data = ['我觉得和-HLH-1','我意思和他-HLW-16']
new_data = []
for s in data:
if s.find("HLH")>0:
new_data.append(s[:s.find("HLH")+3])
elif s.find("HLW")>0:
new_data.append(s[:s.find("HLW")+3])
else:
new_data.append(s)
print(new_data)
df['数据'] = df['数据'].str.extract(r'(.*HL[H|W])', expand=True)