一对多left join(子查询group by)快还是left join副表,主表group by

最近在开发时,发现两种方案关联一对多查询

a表:大表
b表:小表

a -> b :一对多

-- 第一种关联方式
select a.*,b.id from a left join b on a.xx = b.xx group by a.id

-- 第二种关联方式
select a.*,temp.id from a left join(
    select b.xx,b.id from b group by b.id
)temp on a.xx = temp.xx

以上两种方式哪一种效率会更高?

这题是不是有点问题?

  1. 上面是group by a.id ,下面是group by b.id,这两个sql完全不是一回事了 ;
  2. 明明a表是大表,但a表对b表却是1对多?
  3. 没说索引情况
  4. sql标准里,如果有group by,那么select的只能是聚合函数或者group by后面的字段(也可以是常量、变量)。目前常见数据库里只有老版本(8之前)的mysql默认没做这个限制,因此查不符合上述规则的字段时会显示随机数据

b表是小表,因此去重后数据会更少(比如只剩下了10行),而且去重后,数据就变成了1对1,此时A表来关联这个小量的数据,行数不会变大,因此内存消耗也不会变大。但反观第一种,在join的时候,A表的部分数据翻倍了,而且恐怖的是,翻倍是根据B表的重复记录数来的,这个消耗肯定比第2种方式大,所以此时应该第二个sql更快。

img

上图为验证结果,第一种效率高。

显然第一种效率高
因为第二种查询嵌套了子查询

这。。。第二种查询显然是多次一举啊,直接left join b表就行为啥要非得整个子查询呢?你要知道的是子查询会生成临时表 查询速度肯定是慢一点的