spark求交集的结果为什么数据顺序混乱

spark,对两个RDD求交集,为什么数据顺序会乱,预想的结果应该是34567但是结果却是无规则混乱的

img

img

rdd是有分区的,你两个list的元素不一样,得到的rdd的分区数据就不是对应的,比如:3,4在一个在rdd1的分区1;5,6,7在rdd1的分区2;rdd2的分区分区1是3,4,5;rdd2的分区2是6,7。那么考虑元素那么要想得出最终结果,需要两个rdd的两个分区交叉匹配,才能得到结果,涉及shuffle,就会乱序。