想提取dataframe中多个相同特殊字符的最后一个特殊字符前所有字符的怎么实现
如{ee:['字符的最后一个特殊-字符-前所有字-11','字符的最后一个特殊-字符-前所-有字-2']}
得出结果是{ee:['字符的最后一个特殊-字符-前所有字','字符的最后一个特殊-字符-前所-有字']}
暂无
暂无
暂无
{ee:['字符的最后一个特殊-字符-前所有字','字符的最后一个特殊-字符-前所-有字']}
有两个问题:
第一,你所谓的特殊字符,是特指数字还是说只是与前面的不同类型?如果是特指数字,那么用正则匹配替换就可以了;
第二,你的数据格式就是用-隔开的吗? 如果有-隔开的话,取每个字串最后一个’-‘的下标截取字串就可以了;
如果以上都不是的话就比较复杂一点了,需要先判断最后一个字符的类型,然后从后往前找到第一个不是同类型的字符,记录下标,截取字串;
你看看你的需求数属于哪一种?
提供以下思路吧!
如果特殊字符直接就是确定字符,那就直接查找字符,输出最后一个字符的index,然后直接用字符串截取就可以了。
需要代码的话,也可以给你现写
有没有截图示范一下,竟然没有看懂
https://blog.csdn.net/Dlihctcefrep/article/details/109319944
你说的这个东西是论文查重吗
https://blog.csdn.net/weixin_39638468/article/details/110065102
df['ee'] = df['ee'].apply(lambda x:x.split()[0].split('特殊符号')[-1])
从后往前匹配,匹配到的第一次的位置往前截取所有字符串,就是答案
这样试一下
>>> filter_data = df[bool]
>>> print('filter data : \n', filter_data)