大数据处理的主流技术架构

您好,请问现在主流处理大数据的技术架构有哪些?能简略说些这些架构的优缺点是什么。如果学习的话应该从哪个层面进行入门?

这个问题的确太大了,毕竟大数据从存储计算到上层应用,现在已经是一个庞大的家族了。所以,我个人觉得每个组件的诞生,都是为了解决某个场景下的问题。例如,如果你的系统只是一个批处理系统,用MR就可以了;如果你需要进行多种业务的运算,并且每种场景下的指标又不严苛,用Spark就是一个好的选择与折衷。
学习的话,我建议还是先建立基础的知识框架,这样学习起来就能有的放矢,不会迷失在细节的海洋中。