请问应该选择什么数据库安装到集群上进行后续操作呀

想问一下，想爬取这样的数据到hadoop集群上，然后通过idea的springboot项目连接数据库，获取数据进行可视化。请问应该选择什么数据库安装到集群上进行后续操作呀？ mysql吗？还是hive?

可以考虑Kylin或者Presto
也可以把Hive处理好的结果同步到Mysql里
直接连Hive太慢了

小于1000w的数据就mysql吧