如何在一篇文章中遍历出某些关键词的位置。以便对文章添加内连链接等,比如百度百科名片中的关键词链接,它是怎么筛选出来的,有没有又好又快的算法呢。比如我的一篇文章中要遍历出所有实物的关键词(如:猫,狗,车等),有没有什么好的算法呢?
用solr和Elasticsearch
百度那个明显是直接替换,因为经常分词不正确,搞出很多哭笑不得的东西。