为啥使用spark或flink就是实时计算,我在java代码里直接写计算代码就不是了吗?

就比如kafka推送数据后,spark从kafka中拉取数据,再计算。 我直接写消费者 ,计算不行吗?
两者到底啥区别?

直接写消费者,行,也是实时计算。
区别是spark这种功能比较多,比如多态机器分布部署,容错机制,故障恢复等。
所以对于大型系统用spark这种更方便。
如果系统的要求没那么高,那肯定是自己写比较方便了。

所谓的实时计算就是数据进来以后能够立即处理,是相对于离线计算说的,离线计算是对历史数据做的处理。
实时计算和离线计算是大数据出来的概念。
kafaka只是一个消息中间件,用来传递消息用的。