如题 因项目要用到大数据 在网上搜了一圈也没找到 向各位大大们求助!!谢谢各位!!
HDFS中的文件被划分为多个数据块,作为独立的存储单元存放在不同的节点。其中几个主要概念如下:
数据块:一个存储单元即一个数据块,默认大小为128MB。
命名节点(NameNode):HDFS集群中两大类节点之一,用于管理文件系统的命名空间,维护着文件系统树和整棵树内所有的文件和目录。其中,关于文件与数据块的关系信息以两类文件持久保存在本地磁盘:命名空间镜像文件(fsimage)和编辑日志文件(edits);关于数据块与节点的关系信息并未持久保存,而是系统启动时DataNode重建。
数据节点(DataNode): HDFS集群中两大类节点之一,用于根据客户端或NameNode的调度存储和检索数据块,并定期向NameNode发送其所存储块的列表。
辅助命名节点(SecondaryNameNode):该节点与NameNode职责并不相同,其主要作用是定期通过NameNode中的编辑文件(Edits)合并命名空间镜像文件(fsimage)
客户端(Client)通过与NameNode和DataNode交互来访问整个文件系统。
你按照一般对java的字段命名方式就可以了,文件名和hive库名,表名都没有大小写的要求,具体的规则并没有定义过
看你们公司自己的项目开发规范