毕业设计要做一个论文题目查重系统,大体思路从词汇和语义两个层面判断相似。包含相同的关键词是最基本的判断,还要从语义上计算两个题目的相似度。想请教一下如何着手?谢谢!
你用solr就可以,solr中有同义词和分词处理。