关于word中如何识别纯复制内容的方法

工作中涉及大量文件比对工作,请教大家有通过制作模板等方法对类似合同等模板化的文档内容进行辨别,需要辨别文档中纯复制过来的内容,对于修改或打字的内容能够反显出来。谢谢!

如果你有原始文件可以对比,那么可以用最短编辑距离算法判断两段文本的相似性。
http://blog.csdn.net/sdjzping/article/details/12843365

还有一个办法就是计算两段文本的最长公共子串,这样的子串显然就是复制的。
http://blog.csdn.net/zy799894671/article/details/7761171