如果将元数据存储在关系型数据库,小文件问题会解决因为元数据是存放在数据库中,可以支持到十亿级别。同时也没有了加载fsimage操作,同时关系型数据库也可以做HA。
HDFS本身的出发点就不是为了处理小文件而产生的,HDFS的优势在于对大文件的分布式处理能力和备份恢复能力。非要用HDFS处理小文件性能肯定受影响。