需求大概是list和list对比,然后过滤出重叠部分,不希望用 笛卡儿积 ,因为数据量大的时候,非常的慢,希望用filter去过滤。所以想问下rdd中能不能实现:再去过滤一下数据。大致逻辑如下:会提示SparkContext没有序列化的。不知道还有没有什么方式可以实现