求java实现作业查重实现思路或者算法?

描述:是很多同学交上来的作业是抄袭其他同学的。
要求:我要完成的程序就是找出类似的作业。并把他们雷同的内容用高亮的文字显示出来,作为抄袭证据。希望能得到写思路,现在脑袋一片模糊,或者给些资料。谢谢!!!

可以参考下面两个项目:
https://github.com/tianlian0/paper_checking_system

https://dreamspark.com.cn/blog/?id=16

关键字提取,或者求最长公共子串(LCS)

具体google下这两个,有很多论文

这不就是大学的毕业论文查重

楼主你好,最近我也在做这个东西,想知道你做得怎么样了。可以请教一下吗?不胜感激!!

可以参考下面两个项目:
https://github.com/tianlian0/paper_checking_system

https://xincheck.com/?id=16