我需要将客户端的日志文件通过kafka收集后发往hadoop进行统计分析,其中日志文件是一个文件中包括各种类型的日志,我现在不知道kafka收到各个客户端发的日志文件后如何发送到hadoop中,然后hadoop对日志文件中按照日志类型分类,用hive统计分析?求大神给解决方案.
比较常用的解决方案是 Kalfka + Flume,通过Flume将文件写入到HDFS