【故障背景】
8088網頁打不開,因8088是yarn平台的端口,所以我從yarn開始排查,首先到各個機器上使用jps命令查看yarn的各個節點是否啟動,發現雖然有nodemanager進程,但是主節點機器上的resourcemanager進程未啟動,
使用yarn-daemon.sh start resourcemanager單獨啟動resourcemanager進程。遇到閃退,一開啟進程,不一會就自動關閉
【解決步驟】
1. 根據集群規划,到每個zookeeper所在的機器啟動zookeeper
zkServer.sh start
然后zkServer.sh status 查看每個機器的zookeeper是否啟動成功,即是否存在leader、follow
2. 到主節點機器,也就是namenode所在的機器執行
hdfs zkfc -formatZK
3. 重啟Hadoop集群
然后就發現resourcemanager啟動成功,8088端口的網頁可以訪問了。
