对账服务,系统每天定时去第三方下载账单,然后放在内存中进行遍历,去和库里的数据比对。如果下载的账单数量巨大内存装不下。这种情况怎么处理?
一次必须下完?不能下一点处理一点吗
用流的方式处理,下载后放入流(比如队列)中,然后在流里处理账单。
会spark用spark流式处理 不会的就用中间件代替 把数据读出来放在kafka等消息队列里面 然后你的程序从消息队列读取 处理
离线库+离线计算。时效性可以t+1