所有的namenode都是standby状态,且无法手动启动

img

手动启动 hdfs haadmin -transitionToActive nn1,没有反应

集群无法启动吗

看下 zk中记录的信息 是否和你当前的两个NN的信息一致

NN正常选举成功后,ANN会在zookeeper上创建ActiveBreadCrumb节点,记录ANN/SNN的ID与对应的IP信息。

由于该节点是持久化的,因此当NN重启或者重新选举后,会读取该节点的值,从中获取老的ANN的IP信息,用于fencing处理。在此之前,会将节点记录的NN的ID与对应的IP和本地配置的情况进行比较,如果与配置中的不一致,会抛出异常不会再进行后续的处理。

详细参考HDFS——Namenode的HA机制_hncscwc的博客-CSDN博客

看一下zkfc进程挂了吗,先把zkfc启动起来