程序的功能:文档的重复率检查例如:两个(段)英语文档的重复率检查可以使用任何语言都可以编写,请给出程序设计思路,模块划分~
可以用最小编辑距离或者最长公共子串,还可以比较后缀数组,还有分词后提取关键字,方法很多,按照我说的几个关键字自己google下