用的hive本来是select A,B,count()as Cgroup by A,B from X现在想加一列Dselect A,B,count() as C,DFrom Xgroup by A,B,D为什么两个count(*)as C 跑出来的 总数会不一样呢?因为多了一个分组D,我理解每个C项会变 但总的加起来应该不变啊?如果想保证C的总量不变,加上相应的D 应该如何添加呢?求解!万分感谢!
变多是因为你分组更深了,所以组数会越多。你想加上另外的字段,可以用关联查询。