以前的spark因为基于hive,所以在未来有一定的局限性,现在新的spark分为两个部分,sparksql和sparkstreaming,在sql部分感觉和impala有很大的重合,那么这两个在这方面的优缺点有大神能说说吗
http://code.csdn.net/news/2820536
我impala用的比较多,这里面有我记录的各种笔记:http://blog.csdn.net/column/details/impala-action.html