发现现在并没有能够把数仓建模讲透彻的文章,大家基本都集中在各种热门技术栈中
回答不易,求求您采纳点赞哦
所谓的大数据数仓建模不是什么凭空冒出来的新东西,和普通的项目数据库设计本质没有太大区别。
这个事情首先是业务驱动的,比如要统计汇总一些数,总不能每统计一个东西都一条hiveql几百行干到底,这个过程中要考虑运行时间,考虑复用,考虑写的hiveql易懂美观等等,在这个过程中自然而然的就会有分级,分层,再一规范,什么ods层,dw层,ads层,就自然而然的出现了。
建议网上找个案例,你想想该如何做数仓表,做哪些表,再对比一下别人怎么干的,很快就能上手