A文件
1 a 2013-04-01
1 a 2013-04-08
1 a 2013-04-28
2 a 2013-04-08
2 a 2013-11-11
3 a 2016-01-11
B文件
1 a 2013-04-01 2013-04-28 3
2 a 2013-04-08 2013-11-11 2
3 a 2016-01-11 2016-01-11 1
将a文件处理成b文件
求MapReduce代码,实现以前两列为key,比较多个日期从中找出最早最晚时间,并统计出现次数, 如果时间只有一条记录,则最晚最早时间一样,都记录这个时间
或者java代码io处理也可以
感谢
读取 a 文件,按行处理。然后,查找 1 a 等的字符串,然后分类。
你最好是先建立一个 1 a 等分类标志的东东,否则你没有查找分类的依据。
参考下:
http://www.360doc.com/content/14/0909/18/15077656_408219305.shtml