import re
listk = ['同类产品', '市场验证', '视频', '在线视频', '猫咪']
gg = "大应用平台关键字搜索同类产品,这里也许有人会说,我的想法独一无二,目前市面上还没有同类产品,那我觉得该恭喜你,如果你的产品逻辑ok,何不按照自己的思路实现出来交给市场验证。但绝大部分想法都会有同类产品已经出现,除非你是世界上少数的聪明人。"
list = []
for lste in listk:
hh = re.findall(lste, gg, re.S)
hh = ''.join(hh)
if len(hh) > 0:
list.append(hh)
我用“gjc.txt”这个文件里面的词库进行循环匹配“gg”的内容,词库词条多了就报错了
re.error: multiple repeat at position 6
我就是想提取文章中的关键词,比如:我想提取“同类产品”和“市场验证”这个两个关键词
用“jieba”好像是分词,不知道怎么才能匹配文章中指定的关键词,求大佬们指点指点
1 请简化你的程序,你用个txt文件,谁也无法调试你的程序
2 你的目的是什么?你的正则表达式看不懂何意,匹配到了你要干什么?
如果你匹配”同类产品“,r'.*?('+ lste +').*?' 直接 lste不就得了,你这么写正则何意?
如果只是查询是否有关键字,并保存关键字
allkey = []
for l in ls:
if l in gg:
allkey.append(l)
这不就结了?