本文共 383 字,大约阅读时间需要 1 分钟。
HDFS集群有两类节点,即一个NameNode(管理者)和多个DataNode(工作者)。NameNode(以下简称nn)是master,主要负责管理hdfs文件系统,具体地包括namespace管理(其实就是目录结构),block管理(其中包括 filename->block,block->ddatanode list的对应关系)。DataNode(以下简称dn)主要是用来存储数据文件。
还有一个重要的节点:Secondary NameNode,该部分主要是定时对NameNode进行数据snapshots进行备份,这样尽量降低NameNode崩溃之后,导致数据的丢失,其实所作的工作就是从nn获得fsimage和edits把二者重新合并然后发给nn,这样,既能减轻nn的负担又能保险地备份。 体现了分布式架构中的高可用性。
下图为nn和snn交互的工作机制:
转载地址:http://uoksi.baihongyu.com/