点到为止,内容不全,初学者指南

从目录结构及书的篇幅(页码数)来看,这是一本大数据架构入门的书籍。
另外,从大数据架构来说,本书不全面,个人认为少了如下几个方面:
1)数据生成(收集)及清洗,也就是说从大数据开源组件来说,少了Flume/Kafka相关内容
2)数据检索或搜索,对应的大数据组件如solr,ElasticSearch等
3)大数据中间件这块不知道是什么内容,我估计是zookeeper
4)OLAP方面的介绍,如apache Kylin之类的系统
5)整个数据流怎么串起来以及大数据常用的架构,如lambda架构没太多介绍
6)架构实践方面篇幅过少,这个才是干货
总的说来,对初学者而言还是一本可以翻一下的,已经从业的架构师估计能吸收的营养不多了

你说的对,这的确不是一本面面俱到的书,而是让具备一定IT知识但又不了解大数据的人员,以最快速度建立大数据知识框架的书。如果面面俱到,估计没有两千页很难阐述清楚。