小表驱动大表我能理解,但网上有一种说法是"严格来说是小结果集驱动大结果集",这句话我有点疑问。
但是我不明白这个 “小结果集” 是怎么得出来的。
假如有两张表:A和B,SQL语句如下:
select a.id, b.id
from a straight_join b on a.id = b.id
where a.id <= 100;
按照网上流传的SQL语句执行顺序,先执行from和join on语句生成虚拟表,而后用这个虚拟表执行where进行过滤。
疑问就在这里,表的连接是在where之前进行的,这时还没执行到where进行过滤就已经完成表连接了。
这不还是对驱动表进行了全表扫描了嘛,然后哪个表的行数+行数据量小,哪个就是小表,说成是小表驱动大表没问题吧?
为什么说是小结果集?那么这个小结果集是指什么?
难道说小结果集是指在表连接前先对表A执行了where过滤,而后对过滤后的100条数据与表B连接,是不是小结果集还要看where语句?
这样的话确实能提升不少效率,但是就跟SQL执行顺序不符了,这样就是先执行了where再执行了join连接。
或者说网上流传的SQL执行顺序是错的?
你给出的 SQL 查询语句中,where 子句在连接语句之后,但优化器会根据实际情况调整执行顺序,从而找到最优的执行计划。在这个例子中,优化器可能会先执行 where 子句,得到一个小的结果集,然后再将其与表 B 进行连接,从而达到“小结果集驱动大结果集”的效果。这个小的结果集就是通过 where 过滤后的 100 条数据。
不知道你这个问题是否已经解决, 如果还没有解决的话: