问题一:想知道hive是怎么判断sql是转换成mapreduce的时候只有map,没有reduce的?
问题二:是不是只有map端的任务,可能一个maptask会产生多个零时文件,而有reduce端的任务时,一个maptask只会产生一个零时文件?
问题1:使用explain语句可以查看sql转换成mapreduce以后的执行计划,在执行计划里就可以判断是否只有map
问题2:是的
我觉得你先了解一下map和reduce分别是什么样的动作,你就明白了。不需要reduce的时候自然就没有reduce了...