1、hadoop HA分布式集群搭建

本文轉載自查看原文 2017-04-02 23:16 10486 Hadoop

概述

hadoop2中NameNode可以有多個（目前只支持2個）。每一個都有相同的職能。一個是active狀態的，一個是standby狀態的。當集群運行時，只有active狀態的NameNode是正常工作的，standby狀態的NameNode是處於待命狀態的，時刻同步active狀態NameNode的數據。一旦active狀態的NameNode不能工作，standby狀態的NameNode就可以轉變為active狀態的，就可以繼續工作了。

2個NameNode的數據其實是實時共享的。新HDFS采用了一種共享機制，Quorum Journal Node（JournalNode）集群或者Nnetwork File System（NFS）進行共享。NFS是操作系統層面的，JournalNode是hadoop層面的，我們這里使用JournalNode集群進行數據共享（這也是主流的做法）。JournalNode的架構圖如下：

兩個NameNode為了數據同步，會通過一組稱作JournalNodes的獨立進程進行相互通信。當active狀態的NameNode的命名空間有任何修改時，會告知大部分的JournalNodes進程。standby狀態的NameNode有能力讀取JNs中的變更信息，並且一直監控edit log的變化，把變化應用於自己的命名空間。standby可以確保在集群出錯時，命名空間狀態已經完全同步了。

對於HA集群而言，確保同一時刻只有一個NameNode處於active狀態是至關重要的。否則，兩個NameNode的數據狀態就會產生分歧，可能丟失數據，或者產生錯誤的結果。為了保證這點，這就需要利用使用ZooKeeper了。首先HDFS集群中的兩個NameNode都在ZooKeeper中注冊，當active狀態的NameNode出故障時，ZooKeeper能檢測到這種情況，它就會自動把standby狀態的NameNode切換為active狀態。

hadoop-ha包含HDFS的HA和YARN的HA，下面就2個部件的HA進行搭建。

環境介紹：

os:centos7.0

hadoop:2.8.0

zookeeper:3.4.10

5台虛擬機，各服務部署情況如下：

主機名	IP	安裝軟件	運行進程
c7001	192.168.70.101	Hadoop(HA)	NameNode、ResourceManager、DFSZKFailoverController
c7002	192.168.70.102	Hadoop(HA)	NameNode、ResourceManager、DFSZKFailoverController
c7003	192.168.70.103	Hadoop,Zookeeper	DataNode、NodeManager、QuorumPeerMain、JournalNode
c7004	192.168.70.104	Hadoop,Zookeeper	DataNode、NodeManager、QuorumPeerMain、JournalNode
c7005	192.168.70.105	Hadoop,Zookeeper	DataNode、NodeManager、QuorumPeerMain、JournalNode

說明：出於操作的便利性，本篇使用vagrant+virtualbox來搭建虛擬環境。

1、工具安裝

1）、下載並安裝VirtualBox,下載地址 https://www.virtualbox.org/wiki/Downloads 版本為5.1.18

2）、下載並安裝Vagrant,下載地址 https://www.vagrantup.com/downloads.html 版本為1.9.3

3）、從GitHub上Clone ambari的ambari-vagrant到/opt/目錄下，在終端執行：

　　git clone https://github.com/u39kun/ambari-vagrant.git

4）、增加虛擬機的hosts配置到宿主機的/etc/hosts中

　　sudo -s 'cat ambari-vagrant/append-to-etc-hosts.txt >> /etc/hosts'

5）、使用vagrant命令創建一個私鑰

　　vagrant

　　此命令會在宿主機的~/.vagrant.d/目錄下創建insecure_private_key文件，並顯示出vagrant的用法。

2、安裝虛擬機

1）、在/opt目錄下執行

　　cd ambari-vagrant
　　cd centos7.0
　　cp ~/.vagrant.d/insecure_private_key . #此操作為宿主機到虛擬機的無密碼登錄

2)、由於我們是純Hadoop安裝，所以不需要每個虛擬機默認3.7G內存，（如果你宿主機內存多的話，可以不做修改），故修改centos7.0目錄下的Vagrantfile。

　　vb.customize ["modifyvm", :id, "--memory", 2048] # RAM allocated to each VM

3）、通過目錄下./up.sh命令來啟動1或多個虛擬機。每個虛擬機將運行一個hadoop節點。

　　./up.sh <# of VMs to launch>

　　比如要啟動5個虛擬機，則命令為：./up.sh 5

至此我們的工具和虛擬機都已經安裝完成，並且宿主機ssh到各個虛擬機都是無密碼連接。

說明：此種安裝工具和虛擬機的過程需要vpn.

3、無密碼登錄

1）在宿主機終端/opt/ambari-vagrant/centos7.0目錄執行

　　vagrant ssh c7001

　　登錄到c7001,然后執行

　　ssh-keygen -t rsa

　　在~/.ssh/目錄中生成兩個文件id_rsa和id_rsa.pub

　　如果想從c7001免密碼登錄到c7002、c7003、c7004、c7005中要在c7001中執行

　　ssh-copy-id -i ~/.ssh/id_rsa.pub vagrant@c7001
　　ssh-copy-id -i ~/.ssh/id_rsa.pub vagrant@c7002
　　ssh-copy-id -i ~/.ssh/id_rsa.pub vagrant@c7003
　　ssh-copy-id -i ~/.ssh/id_rsa.pub vagrant@c7004
　　ssh-copy-id -i ~/.ssh/id_rsa.pub vagrant@c7005

　實現c7001、c7002、c7003、c7004、c7005任意之間的無密碼登錄，重復上述步驟。

4、安裝ZooKeeper集群

　　此處不再贅述，請參看http://www.cnblogs.com/netbloomy/p/6658041.html

5、在c7001、c7002、c7003、c7004、c7005機器的/opt目錄下安裝jdk,並設置環境變量

　　wget http://download.oracle.com/otn-pub/java/jdk/8u121-b13/e9e7ea248e2c4826b92b3f075a80e441/jdk-8u121-linux-x64.tar.gz?AuthParam=1491205869_4d911aca9d38a4b869d2a6ecaa9bbf47

　　tar zxvf jdk-8u121-linux-x64.tar.gz

　　vi ~/.bash_profile

　　export JAVA_HOME=/opt/jdk1.8.0_121
　　export PATH=$PATH:$JAVA_HOME/bin

6、安裝Hadoop集群

1）、下載並解壓hadoop

　　在c7001、c7002、c7003、c7004、c7005的終端目錄/opt下執行如下命令：

　　wget http://219.238.4.196/files/705200000559DFDC/apache.communilink.net/hadoop/common/hadoop-2.8.0/hadoop-2.8.0.tar.gz

　　然后再把各個機器上的hadoop解壓　　

　　tar zxvf hadoop-2.8.0.tar.gz

2）、在c7001終端修改hadoop配置文件，這里需要修改的有core-site.xml、hdfs-site.xml、mapreduce-site.xml、yarn-site.xml、hadoop-env.sh、mapred-env.sh、yarn-env.sh這7個文件

core-site.xml

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>fs.defaultFS</name>

<value>hdfs://bdcluster</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/opt/hadoop-2.8.0/tmp</value>

</property>

<name>ha.zookeeper.quorum</name>

</property>

<name>ha.zookeeper.session-timeout.ms</name>

</property>

</configuration>

hdfs-site.xml

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>dfs.nameservices</name>

<value>bdcluster</value>

</property>

<name>dfs.ha.namenodes.bdcluster</name>

</property>

<name>dfs.namenode.rpc-address.bdcluster.nn1</name>

</property>

<name>dfs.namenode.rpc-address.bdcluster.nn2</name>

</property>

<name>dfs.namenode.http-address.bdcluster.nn1</name>

</property>

<name>dfs.namenode.http-address.bdcluster.nn2</name>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://c7003:8485;c7004:8485;c7005:8485/bdcluster</value>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/opt/hadoop-2.8.0/tmp/journal</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

<name>dfs.client.failover.proxy.provider.bdcluster</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider

</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>

sshfence

shell(/bin/true)

</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/home/vagrant/.ssh/id_rsa</value>

</property>

<name>dfs.ha.fencing.ssh.connect-timeout</name>

</property>

<name>dfs.namenode.name.dir</name>

<value>file:///opt/hadoop-2.8.0/hdfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:///opt/hadoop-2.8.0/hdfs/data</value>

</property>

<name>dfs.replication</name>

</property>

</configuration>

mapred-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

</property>

</configuration>

yarn-site.xml

<?xml version="1.0"?>

<name>yarn.resourcemanager.ha.enabled</name>

</property>

<name>yarn.resourcemanager.recovery.enabled</name>

</property>

<name>yarn.resourcemanager.cluster-id</name>

</property>

<name>yarn.resourcemanager.ha.rm-ids</name>

</property>

<name>yarn.resourcemanager.hostname.rm1</name>

</property>

<name>yarn.resourcemanager.hostname.rm2</name>

</property>

<!-- <property> <name>yarn.resourcemanager.ha.id</name> <value>rm1</value>

<description>If we want to launch more than one RM in single node,we need

this configuration</description> </property> -->

<name>ha.zookeeper.quorum</name>

</property>

!--配置與zookeeper的連接地址-->

<name>yarn.resourcemanager.zk-state-store.address</name>

</property>

<name>yarn.resourcemanager.store.class</name>

<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore

</value>

</property>

<name>yarn.resourcemanager.zk-address</name>

</property>

<name>yarn.resourcemanager.ha.automatic-failover.zk-base-path</name>

<value>/yarn-leader-election</value>

<description>Optionalsetting.Thedefaultvalueis/yarn-leader-election

</description>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

hadoop-env.sh & mapred-env.sh & yarn-env.sh

export JAVA_HOME=/opt/jdk1.8.0_121
export CLASS_PATH=$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export HADOOP_HOME=/opt/hadoop-2.8.0
export HADOOP_PID_DIR=/opt/hadoop-2.8.0/pids
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="$HADOOP_OPTS-Djava.library.path=$HADOOP_HOME/lib/native"
export HADOOP_PREFIX=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export HDFS_CONF_DIR=$HADOOP_HOME/etc/hadoop
export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop
export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

slaves

c7001
c7002
c7003
c7004
c7005

然后通過執行如下命令將c7001修改好的配置文件同步到c7002、c7003、c7004、c7005：

scp -r /opt/hadoop-2.8.0/etc/hadoop vagrant@c7002:/opt/hadoop-2.8.0/etc/
scp -r /opt/hadoop-2.8.0/etc/hadoop vagrant@c7003:/opt/hadoop-2.8.0/etc/
scp -r /opt/hadoop-2.8.0/etc/hadoop vagrant@c7004:/opt/hadoop-2.8.0/etc/
scp -r /opt/hadoop-2.8.0/etc/hadoop vagrant@c7005:/opt/hadoop-2.8.0/etc/

至此，hadoop的配置文件已經全部配置完畢

7、啟動Hadoop集群

1）、啟動zookeeper集群
分別在c7003、c7004、c7005上執行如下命令啟動zookeeper集群；
[vagrant@c7003 bin]$ sh zkServer.sh start
驗證集群zookeeper集群是否啟動，分別在c7003、c7004、c7005上執行如下命令驗證zookeeper集群是否啟動，集群啟動成功，有兩個follower節點跟一個leader節點；
[vagrant@c7003 bin]$ sh zkServer.sh status
JMX enabled by default
Using config: /opt/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: follower
2）、啟動journalnode集群
在c7001上執行如下命令完成JournalNode集群的啟動
[vagrant@c7001 hadoop-2.8.0]$ sbin/hadoop-daemons.sh start journalnode
執行jps命令，可以查看到JournalNode的java進程pid
3）、格式化zkfc,讓在zookeeper中生成ha節點
在c7001上執行如下命令，完成格式化
hdfs zkfc -formatZK
格式成功后，查看zookeeper中可以看到
[zk: localhost:2181(CONNECTED) 1] ls /hadoop-ha
[bdcluster]
4）、格式化hdfs
hadoop namenode -format
5）、啟動NameNode
首先在c7001上啟動active節點，在c7001上執行如下命令
[vagrant@c7001 hadoop-2.8.0]$ sbin/hadoop-daemon.sh start namenode
在c7002上同步namenode的數據，同時啟動standby的namenod,命令如下
#把NameNode的數據同步到c7002上
[vagrant@c7002 hadoop-2.8.0]$ bin/hdfs namenode -bootstrapStandby
#啟動c7002上的namenode作為standby
[vagrant@c7002 hadoop-2.8.0]$ sbin/hadoop-daemon.sh start namenode
6）、啟動啟動datanode
在c7001上執行如下命令
[vagrant@c7001 hadoop-2.8.0]$ sbin/hadoop-daemons.sh start datanode
7）、啟動yarn
在作為資源管理器上的機器上啟動，我這里是c7001,執行如下命令完成year的啟動
[vagrant@c7001 hadoop-2.8.0]$ sbin/start-yarn.sh

8）、啟動ZKFC
在c7001上執行如下命令，完成ZKFC的啟動
[vagrant@c7001 hadoop-2.8.0]$ sbin/hadoop-daemons.sh start zkfc
全部啟動完后分別在c7001、c7002、c7003、c7004、c7005上執行jps是可以看到下面這些進程的
#c7001上的java PID進程
[vagrant@c7001 hadoop-2.8.0]$ jps
7857 DataNode
7270 JournalNode
8118 NodeManager
8550 DFSZKFailoverController
8007 ResourceManager
8968 NameNode
9065 Jps
#c7002上的java PID進程
[vagrant@c7002 hadoop-2.8.0]$ jps
6929 DFSZKFailoverController
6738 NodeManager
6441 NameNode
6603 DataNode
6221 JournalNode
7615 Jps
#c7003上的java PID進程
[vagrant@c7003 hadoop-2.8.0]$ jps
6040 DataNode
6473 Jps
4764 QuorumPeerMain
5870 JournalNode
6175 NodeManager
#c7004上的java PID進程
[vagrant@c7004 hadoop-2.8.0]$ jps
4739 QuorumPeerMain
5875 JournalNode
6180 NodeManager
6475 Jps
6046 DataNode
#c7005上的java PID進程
6227 NodeManager
6518 Jps
6091 DataNode
5916 JournalNode
4813 QuorumPeerMain

8、測試NameNode HA的高可用性
啟動后c7001的namenode和c7002的namenode如下所示：

此時在c7001上執行如下命令關閉c7001上的namenode

[vagrant@c7001 hadoop-2.8.0]$ sbin/hadoop-daemon.sh stop namenode

再次查看c7002上的namenode，發現自動切換為active了！證據如下：

上述驗證也可以使用命令hdfs haadmin進行查看NameNode的狀態
查看namenode工作狀態
hdfs haadmin -getServiceState nn1
將standby狀態namenode切換到active
hdfs haadmin –transitionToActive nn1
將active狀態namenode切換到standby
hdfs haadmin –transitionToStandby nn2

9、ResourceManager HA

NameNode HA操作完之后我們可以發現只有一個節點（這里是c7001）啟動，需要手動啟動另外一個節點（c7002）的resourcemanager。
sbin/yarn-daemon.sh start resourcemanager
然后用以下指令查看resourcemanager狀態
yarn rmadmin -getServiceState rm1
結果顯示Active

yarn rmadmin -getServiceState rm2
而rm2是standby。
驗證HA和NameNode HA同理，kill掉Active resourcemanager，則standby的resourcemanager則會轉換為Active。
還有一條指令可以強制轉換
yarn rmadmin –transitionToStandby rm1

注意：yarn-site.xml的

<property>
　　　　<name>yarn.resourcemanager.ha.id</name>
　　　　<value>rm1</value>
　　　　<description>If we want to launch more than one RM in single node,we need this configuration</description>
　</property>

在c7001上配置是rm1,而在c7002上一定要配置rm2,如果不修改，c7002的resourcemanager啟動不了。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Hadoop、Spark——完全分布式HA集群搭建 Hadoop分布式集群搭建 Hadoop完全分布式集群搭建 hadoop 完全分布式集群搭建 hadoop分布式集群搭建分布式集群HA模式部署 HA分布式集群二hive配置 hadoop3.1.1 HA高可用分布式集群安裝部署使用Docker在本地搭建Hadoop分布式集群使用Docker搭建Hadoop集群(偽分布式與完全分布式)