订单表和订单明细表join时,数据量大,能不能用分桶表优化?
订单表和订单明细表上如果有同样的日期,可以尝试按日期范围把数据拆开,毕竟大数据计算的最大特点之一就是所谓的分布式。另外,在大数据仓里,其实建议导入数据的时候,就把订单表和订单明细表join起来一起导入,当然订单表也还是要单独导入一份,这样虽然占用了更多的存储空间,但这是以空间换时间的一种有效做法