Hadoop的HA集群啟動和停止流程



假設我們有3台虛擬機,主機名分別是hadoop01、hadoop02和hadoop03。
這3台虛擬機的Hadoop的HA集群部署計划如下:
    
3台虛擬機的Hadoop的HA集群部署計划
hadoop01
zookeeper
journalnode
nodemanager
datanode
resourcemanager
namenode
zkfc
hadoop02
zookeeper
journalnode
nodemanager
datanode
resourcemanager
namenode
zkfc
hadoop03
zookeeper
journalnode
nodemanager
datanode
     






從上面的集群部署計划中可以看出,3台機器上都部署了Zookeeper、journalnode、nodemanager、datanode,而只有hadoop01和hadoop02這兩台機器上部署有zkfc和ResourceManager以及NameNode。 下面是Hadoop的HA集群啟動流程: 第一步,在Hadoop01機器上啟動Zookeeper: [root@hadoop01 ~]# /root/apps/zookeeper/bin/zkServer.sh start 第二步,在Hadoop02機器上啟動Zookeeper: [root@hadoop02 ~]# /root/apps/zookeeper/bin/zkServer.sh start 第三步,在Hadoop03機器上啟動Zookeeper: [root@hadoop03 ~]# /root/apps/zookeeper/bin/zkServer.sh start 啟動Zookeeper之后,可以分別在3台機器上使用如下命令查看Zookeeper的啟動狀態: /root/apps/zookeeper/bin/zkServer.sh status 第四步,在Hadoop01機器上啟動HDFS: [root@hadoop01 ~]# /root/apps/hadoop/sbin/start-dfs.sh 第五步,在Hadoop01機器上啟動YARN: [root@hadoop01 ~]# /root/apps/hadoop/sbin/start-yarn.sh 第六步,在Hadoop02機器上單獨啟動一個ResourceManager: (注意這里使用的是“yarn-daemon.sh”命令,而不是“hadoop-daemon.sh”,不知道為什么使用“hadoop-daemon.sh”無法啟動ResourceManager) [root@hadoop02 ~]# /root/apps/hadoop/sbin/yarn-daemon.sh start resourcemanager 最后,分別在3台機器上使用jps命令查看進程: [root@hadoop01 ~]# jps 2836 ResourceManager 2310 DataNode 2036 QuorumPeerMain 2630 DFSZKFailoverController 2481 JournalNode 2938 NodeManager 3212 Jps 2212 NameNode [root@hadoop02 ~]# jps 2489 DFSZKFailoverController 3281 Jps 2193 QuorumPeerMain 2292 NameNode 2348 DataNode 3028 NodeManager 2427 JournalNode 3244 ResourceManager [root@hadoop03 ~]# jps 2734 Jps 2420 DataNode 2327 QuorumPeerMain 2484 JournalNode 2616 NodeManager [root@hadoop03 ~]# 如果某一個NameNode進程掛掉了的話,就使用如下命令單獨啟動一個NameNode: /root/apps/hadoop/sbin/hadoop-daemon.sh start namenode ================================================================ 下面是停止Hadoop的HA集群的流程: 第一步,在Hadoop01機器上停止HDFS: [root@hadoop01 ~]# /root/apps/hadoop/sbin/stop-dfs.sh 第二步,在Hadoop01機器上停止YARN: [root@hadoop01 ~]# /root/apps/hadoop/sbin/stop-yarn.sh 第三步,在Hadoop02機器上單獨停止ResourceManager: [root@hadoop02 ~]# /root/apps/hadoop/sbin/yarn-daemon.sh stop resourcemanager 第四步,在Hadoop01機器上停止Zookeeper: [root@hadoop01 ~]# /root/apps/zookeeper/bin/zkServer.sh stop 第五步,在Hadoop02機器上停止Zookeeper: [root@hadoop02 ~]# /root/apps/zookeeper/bin/zkServer.sh stop 第六步,在Hadoop03機器上停止Zookeeper: [root@hadoop03 ~]# /root/apps/zookeeper/bin/zkServer.sh stop 最后,分別在3台機器上使用jps命令查看進程,確定有關進程是否停止成功。 [root@hadoop01 ~]# jps 4455 Jps [root@hadoop02 sbin]# jps 4713 Jps [root@hadoop03 ~]# jps 3208 Jps 如果啟動或停止Hadoop的時候,遇到了問題,我們想查看一下日志,由於日志中的內容可能會非常多,我們改怎么查看呢?我們以查看hadoop01機器上的namenode的日志為例來說明一下,這里我們使用的是less命令: [root@hadoop01 ~]# less /root/apps/hadoop/logs/hadoop-root-namenode-hadoop01.log 使用以上命令進入到日志之后,按回車光標處會顯示一個冒號,輸入斜杠“/”會進入到搜索模式,輸入關鍵字再按回車,可以在日志中查詢關鍵字小寫的字母“n”可以向下搜索關鍵字,輸入大寫的字母“N”可以向上查找關鍵字。 在鍵盤上輸入大寫的字母“G”,可以瞬間跳轉到日志的末尾。 輸入小寫字母“q”可以退出日志。

 

如果覺得本文對您有幫助,不妨掃描下方微信二維碼打賞點,您的鼓勵是我前進最大的動力:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM