比较两个大文件,找出相同内容,和互不存在的内容(只能java实现,不能用数据库之类的)

两个文件存储数据以某列为主键(如学号,还有100多列其它字段)如何对比找出相同数据、不同数据、两个文件之间互不存在的数据这些情况:两个文件都超过1G?(不用elasearch、建表关联这些,纯java实现方式)

仅供参考:

1、如果内存足够大,直接读到内存中直接处理就完了; 

2、考虑将文件数据中的每一行数据进行计算,得到一个md5,比较两个文件不同行的md5值即可,达到节省内存的目的;