hi,假设我有一个spark RDD里面记录的是(时段,分数,次数)我现在想求:每个时段的平均分数,即:同一个时段下,总分数 / 总次数不知有什么好方法没有,因为我发现无论是action操作也好,转换成其他Rdd也好,总没有满意方法,只能分成两个rdd然后关联处理
求大侠帮忙,谢谢
先转化为pairrdd,以时段为键,分数次数为值,然后以键aggregate聚合,统计每个键下的值就行了