两张百万级的数据表比对?除了java集合以外,还有什么好的或者新型的技术?

两张百万级的数据表比对?除了java集合以外,还有什么好的或者新型的技术?

spark