为啥使用spark或flink就是实时计算，我在java代码里直接写计算代码就不是了吗？

就比如kafka推送数据后，spark从kafka中拉取数据，再计算。我直接写消费者，计算不行吗？
两者到底啥区别？

直接写消费者，行，也是实时计算。
区别是spark这种功能比较多，比如多态机器分布部署，容错机制，故障恢复等。
所以对于大型系统用spark这种更方便。
如果系统的要求没那么高，那肯定是自己写比较方便了。

所谓的实时计算就是数据进来以后能够立即处理，是相对于离线计算说的，离线计算是对历史数据做的处理。
实时计算和离线计算是大数据出来的概念。
kafaka只是一个消息中间件，用来传递消息用的。