【HDFS篇12】HA高可用 --- HDFS-HA集群配置

本文轉載自查看原文 2020-07-13 09:11 499 大數據

保持自己的節奏前進就對了

HDFDS-HA集群配置

(一)環境准備

修改IP
修改主機名及主機名和IP地址的映射
關閉防火牆
ssh免密登錄
安裝JDK，配置環境變量等

(二)規划集群

看出我們將NameNode分布到兩台機器上，保證集群的高可用性

hadoop102	hadoop103	hadoop104
NameNode	NameNode
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode
ZK	ZK	ZK
	ResourceManager
NodeManager	NodeManager	NodeManager

(三)配置Zookeeper集群

1.集群規划

在hadoop102、hadoop103和hadoop104三個節點上部署Zookeeper。

2.解壓安裝

（1）解壓Zookeeper安裝包到/opt/module/目錄下

tar -zxvf zookeeper-3.4.10.tar.gz -C /opt/module/

（2）在/opt/module/zookeeper-3.4.10/這個目錄下創建zkData

mkdir -p zkData

（3）重命名/opt/module/zookeeper-3.4.10/conf這個目錄下的zoo_sample.cfg為zoo.cfg

mv zoo_sample.cfg zoo.cfg

3.配置zoo.cfg文件

（1）具體配置

dataDir=/opt/module/zookeeper-3.4.10/zkData

增加如下配置

\#######################cluster##########################

server.2=hadoop102:2888:3888

server.3=hadoop103:2888:3888

server.4=hadoop104:2888:3888

（2）配置參數解讀

Server.A=B:C:D。

A是一個數字，表示這個是第幾號服務器；

B是這個服務器的IP地址；

C是這個服務器與集群中的Leader服務器交換信息的端口；

D是萬一集群中的Leader服務器掛了，需要一個端口來重新進行選舉，選出一個新的Leader，而這個端口就是用來執行選舉時服務器相互通信的端口。

集群模式下配置一個文件myid，這個文件在dataDir目錄下，這個文件里面有一個數據就是A的值，Zookeeper啟動時讀取此文件，拿到里面的數據與zoo.cfg里面的配置信息比較從而判斷到底是哪個server。

4.集群操作

（1）在/opt/module/zookeeper-3.4.10/zkData目錄下創建一個myid的文件

touch myid
添加myid文件，注意一定要在linux里面創建，在notepad++里面很可能亂碼

（2）編輯myid文件

vi myid
在文件中添加與server對應的編號：如2

（3）拷貝配置好的zookeeper到其他機器上

scp -r zookeeper-3.4.10/ [root@hadoop103.atguigu.com:/opt/app/](mailto:root@hadoop103.atguigu.com:/opt/app/)

scp -r zookeeper-3.4.10/ [root@hadoop104.atguigu.com:/opt/app/](mailto:root@hadoop104.atguigu.com:/opt/app/)

並分別修改myid文件中內容為3、4

（4）分別啟動zookeeper

[root@hadoop102 zookeeper-3.4.10]# bin/zkServer.sh start

[root@hadoop103 zookeeper-3.4.10]# bin/zkServer.sh start

[root@hadoop104 zookeeper-3.4.10]# bin/zkServer.sh start

（5）查看狀態

[root@hadoop102 zookeeper-3.4.10]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/module/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: follower

[root@hadoop103 zookeeper-3.4.10]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/module/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: leader

[root@hadoop104 zookeeper-3.4.5]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/module/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: follower

(四)配置HDFS-HA集群

1.官方地址

http://hadoop.apache.org/

2.在opt目錄下創建一個ha文件夾

mkdir ha

3.將/opt/app/下的 hadoop-2.7.2拷貝到/opt/ha目錄下

cp -r hadoop-2.7.2/ /opt/ha/

4.配置hadoop-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_144

5.配置core-site.xml

<configuration>
<!-- 把兩個NameNode）的地址組裝成一個集群mycluster -->
		<property>
			<name>fs.defaultFS</name>
        	<value>hdfs://mycluster</value>
		</property>

		<!-- 指定hadoop運行時產生文件的存儲目錄 -->
		<property>
			<name>hadoop.tmp.dir</name>
			<value>/opt/ha/hadoop-2.7.2/data/tmp</value>
		</property>
</configuration>

6.配置hdfs-site.xml

<configuration>
	<!-- 完全分布式集群名稱 -->
	<property>
		<name>dfs.nameservices</name>
		<value>mycluster</value>
	</property>

	<!-- 集群中NameNode節點都有哪些 -->
	<property>
		<name>dfs.ha.namenodes.mycluster</name>
		<value>nn1,nn2</value>
	</property>

	<!-- nn1的RPC通信地址 -->
	<property>
		<name>dfs.namenode.rpc-address.mycluster.nn1</name>
		<value>hadoop102:9000</value>
	</property>

	<!-- nn2的RPC通信地址 -->
	<property>
		<name>dfs.namenode.rpc-address.mycluster.nn2</name>
		<value>hadoop103:9000</value>
	</property>

	<!-- nn1的http通信地址 -->
	<property>
		<name>dfs.namenode.http-address.mycluster.nn1</name>
		<value>hadoop102:50070</value>
	</property>

	<!-- nn2的http通信地址 -->
	<property>
		<name>dfs.namenode.http-address.mycluster.nn2</name>
		<value>hadoop103:50070</value>
	</property>

	<!-- 指定NameNode元數據在JournalNode上的存放位置 -->
	<property>
		<name>dfs.namenode.shared.edits.dir</name>
	<value>qjournal://hadoop102:8485;hadoop103:8485;hadoop104:8485/mycluster</value>
	</property>

	<!-- 配置隔離機制，即同一時刻只能有一台服務器對外響應 -->
	<property>
		<name>dfs.ha.fencing.methods</name>
		<value>sshfence</value>
	</property>

	<!-- 使用隔離機制時需要ssh無秘鑰登錄-->
	<property>
		<name>dfs.ha.fencing.ssh.private-key-files</name>
		<value>/home/zhutiansama/.ssh/id_rsa</value>
	</property>

	<!-- 聲明journalnode服務器存儲目錄-->
	<property>
		<name>dfs.journalnode.edits.dir</name>
		<value>/opt/ha/hadoop-2.7.2/data/jn</value>
	</property>

	<!-- 關閉權限檢查-->
	<property>
		<name>dfs.permissions.enable</name>
		<value>false</value>
	</property>

	<!-- 訪問代理類：client，mycluster，active配置失敗自動切換實現方式-->
	<property>
  		<name>dfs.client.failover.proxy.provider.mycluster</name>
	<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
	</property>
</configuration>

7.拷貝配置好的hadoop環境到其他節點

(五)啟動HDFS-HA集群

1.在各個JournalNode節點上，輸入以下命令啟動journalnode服務

sbin/hadoop-daemon.sh start journalnode

2.在[nn1]上，對其進行格式化，並啟動

bin/hdfs namenode -format
sbin/hadoop-daemon.sh start namenode

3.在[nn2]上，同步nn1的元數據信息

bin/hdfs namenode -bootstrapStandby

4.啟動[nn2]

sbin/hadoop-daemon.sh start namenode

5.Web頁面查看

6.在[nn1]上，啟動所有datanode

sbin/hadoop-daemons.sh start datanode

7.將[nn1]切換為Active

bin/hdfs haadmin -transitionToActive nn1

8.查看是否Active

bin/hdfs haadmin -getServiceState nn1

(六)配置HDFS-HA自動故障轉移

1.具體配置

（1）在hdfs-site.xml中增加

<property>
	<name>dfs.ha.automatic-failover.enabled</name>
	<value>true</value>
</property>

（2）在core-site.xml文件中增加

<property>
	<name>ha.zookeeper.quorum</name>
	<value>hadoop102:2181,hadoop103:2181,hadoop104:2181</value>
</property>

2.啟動

（1）關閉所有HDFS服務：

sbin/stop-dfs.sh

（2）啟動Zookeeper集群：

bin/zkServer.sh start

（3）初始化HA在Zookeeper中狀態：

bin/hdfs zkfc -formatZK

（4）啟動HDFS服務：

sbin/start-dfs.sh

（5）在各個NameNode節點上啟動DFSZK Failover Controller，先在哪台機器啟動，哪個機器的NameNode就是Active NameNode

sbin/hadoop-daemin.sh start zkfc

3.驗證

（1）將Active NameNode進程kill

kill -9 namenode的進程id

（2）將Active NameNode機器斷開網絡

service network stop