在分布式文件系统HDFS的数据复制流水线策略中,有描述说NameNode返回一个DataNode列表给客户端,客户端开始向第一个DataNode写数据,然后“当数据节点接收到4KB的数据后就写入本地并把4KB数据和列表传给第二个数据节点”,这里4KB什么意思啊?是设置的默认值吗,为什么一个数据节点只存4KB的数据,文件块的大小不是默认64M或者128M吗?
这是哪里看到的4KB?
HDFS的数据传输是以packet为单位进行传输的, 每个packet里面又由多个chunk组成,chunk大小默认为512字节,而packet大小应该是64KB
详细可参考(https://blog.csdn.net/hncscwc/article/details/119467272
另外,写流程可参考(https://blog.csdn.net/hncscwc/article/details/119467272