大数据量中文匹配该怎么实现?

设计一个敏感词过滤程序,用户提交的内容(长度在140字之内)需要判断是否包含敏感词库中的敏感词,敏感词库约有10万个敏感词,要求高性能,不能进行遍历匹配,用python 怎么实现?PHP也可以

Elasticearch搜索引擎了解下

异步celery。先存下来,状态是未检测

异步检测完了,状态修改一下就得了

可以去看看专门的敏感词服务 , 三方提供的