zookeeper集群的搭建以及hadoop ha的相關配置

本文轉載自查看原文 2016-12-15 19:27 1861 zookeeper/ hadoop/ 大數據

1、環境

centos7 hadoop2.6.5 zookeeper3.4.9 jdk1.8

master作為active主機，data1作為standby備用機，三台機器均作為數據節點，yarn資源管理器在master上開啟，在data1上備用，data1上開啟歷史服務器

主要參考見下表

master	192.168.1.215	Namenode DataNode QuorumPeerMain ZKFC JournalNode ResourceManager NodeManager
data1	192.168.1.218	Namenode DataNode QuorumPeerMain ZKFC JournalNode ResourceManager NodeManager JobHistoryServer ApplicationHistoryServer
data2	192.168.1.219	DataNode QuorumPeerMain JournalNode NodeManager

2、zookeeper集群的搭建

安裝到/usr/Apache目錄下，所有者與所屬組均為hadoop

tar -zxvf zookeeper-3.4.9.tar.gz -C /usr/Apache/
ln -s zookeeper-3.4.9/ zookeeper
cd zookeeper/conf
# 配置文件
cp zoo_sample.cfg zoo.cfg

# 編輯zoo.cfg的內容
# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial 
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between 
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just 
# example sakes.
dataDir=/usr/Apache/zookeeper/data dataLogDir=/usr/Apache/zookeeper/data/log
# the port at which the clients will connect
clientPort=2181
# the maximum number of client connections.
# increase this if you need to handle more clients
maxClientCnxns=60
#
# Be sure to read the maintenance section of the 
# administrator guide before turning on autopurge.
#
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
autopurge.purgeInterval=1
#
server.1=master:2888:3888 server.2=data1:2888:3888 server.3=data2:2888:3888

一般采用默認值，重點是標藍的地方。

數據的路徑單獨設，將日志分開，並且，不要放到默認的tmp文件夾下面，因為這個會定期刪除

dataDir=/usr/Apache/zookeeper/data dataLogDir=/usr/Apache/zookeeper/data/log

將快照打開，並且設置autopurge.purgeInterval=1，與上面的不同，快照需要定期刪除

增大客戶端的連接數量maxClientCnxns=60

先安裝到master下面，之后進行分發

scp -r zookeeper-3.4.9 data1:usr/Apache/
scp -r zookeeper-3.4.9 data2:usr/Apache/
# 注意所屬組與所有者
chown -R hadoop:hadoop zookeeper
# 分別在三台機器的/usr/Apache/zookeeper/data目錄下建立myid文件,分別寫入數字1、2、3，這點很重要
cd /usr/Apache/zookeeper/data/
touch myid
# 三台機器分別啟動
zkServer.sh start
# 查看狀態
zkServer.sh status
# 最后，檢查，關閉一個看是否自動選舉

3、hadoop以及yarn的高可用配置

先前安裝過，主要是配置文件的修改，注意，如果不重新安裝，需要刪除一些文件 rm -rf tmp/* data/nn/* data/jn/* data/dn/* data/dn/* logs/*

上面的data/nn data/jn data/dn data/dn 是自己建的一些文件，用於節點數據的存放。

重新安裝也不麻煩，此處選擇重新安裝，目錄選擇/usr/Apache，所有者與所屬組均為hadoop，環境變量如下：

更改環境變量，hadoop用戶下面的~/.bashrc文件
export HADOOP_HOME=/usr/Apache/hadoop
export ZOOKEEPER_HOME=/usr/Apache/zookeeper
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_YARN_HOME=$HADOOP_HOME
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export CLASSPATH=.:$HADOOP_HOME/lib:$CLASSPATH
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZOOKEEPER_HOME/bin
# 之后
source ~/.bashrc

下面關鍵看配置

1> core-site.xml

<configuration>
<!--緩存文件存儲的路徑，可以這樣寫file:/opt/mdisk/disk02/data/tmp,file:/opt/mdisk/disk01/data/tmp-->
<!--如果掛載多個數據盤，用逗號分開-->
<!--配置緩存文件的目錄，注意另建新的文件夾tmp，不要在hadoop/tmp下，因為會定期刪除-->
<property>
<name>hadoop.tmp.dir</name>
     <value>/usr/Apache/hadoop/data/tmp</value>
    <description>A base for other temporary directories.</description>
</property>

<!--指定nameservice的名稱，自定義，但后面必須保持一致-->
<property>
    <name>fs.defaultFS</name>
    <value>hdfs://nscluster</value>
</property>

<!-- 編輯日志文件存儲的路徑，這個也可以放到hdfs-site.xml中 -->
<property>
    <name>dfs.journalnode.edits.dir</name>
    <value>/usr/Apache/hadoop/data/jn</value>
</property>

<!--文件讀寫緩存大小，此處為128kb-->
<property>
  <name>io.file.buffer.size</name>
  <value>131072</value>
</property>

<!--指定zookeeper地址，配置HA時需要，這個也可以放到hdfs-site.xml中-->
<!--<property>
    <name>ha.zookeeper.quorum</name>
    <value>master:2181,data1:2181,data2:2181</value>
</property>-->

<!--以下不是必須的-->
<!--配置hdfs文件被永久刪除前保留的時間（單位：分鍾），默認值為0表明垃圾回收站功能關閉-->
<!--<property>
    <name>fs.trash.interval</name>
    <value>0</value>
</property>-->

<!--指定可以在任何IP訪問-->
<!--<property>
    <name>hadoop.proxyuser.hduser.hosts</name>
    <value>*</value>
</property>-->

<!--指定所有用戶可以訪問-->
<!--<property>
    <name>hadoop.proxyuser.hduser.groups</name>
    <value>*</value>
</property>-->
</configuration>

這里要注意hadoop.tmp.dir這個屬性，上面的注釋也已經說了，一定不要放到暫時的hadoop/tmp中，而要放到永久的文件夾中，否則namenode的啟動可能遇到問題。

上面一些注釋掉的屬性不是必須的，下面一樣。

2> hdfs-site.xml

注意下面的nscluster是自定義的名稱，並且被應用於多個屬性中，部署使用時更改樣式

<configuration>

<!--指定hdfs元數據存儲的路徑-->
<property>
    <name>dfs.namenode.name.dir</name>
    <value>file:/usr/Apache/hadoop/data/nn</value>
</property>

<!--指定hdfs數據存儲的路徑-->
<property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/usr/Apache/hadoop/data/dn</value>
</property>

<!--開啟WebHDFS功能（基於REST的接口服務）-->
<property>
    <name>dfs.webhdfs.enabled</name>
    <value>true</value>
</property>

<!-- 數據備份的個數 -->
<property>
    <name>dfs.replication</name>
    <value>3</value>
</property>    

<!--關閉權限驗證 -->
<property>
    <name>dfs.permissions.enabled</name>
    <value>false</value>
</property>

<!--DateNode上的服務線程數，處理rpc，默認為10，可以調大-->
<property>
    <name>dfs.datanode.handler.count</name>
    <value>200</value>
</property>

<!--文件操作的線程數，如果處理文件有很多，則調大，建議值8192-->
<property>
    <name>dfs.datanode.max.transfer.threads</name> 
    <value>8192</value> 
</property>

<!--不用的數據節點，添加到excludes文件，方法同slaves文件，之后執行hadoop dfsadmin -refreshNodes命令-->
<property>
    <name>dfs.hosts.exclude</name>
    <value>/usr/Apache/hadoop/etc/hadoop/excludes</value>
</property>

<!--以下為ha的相關配置-->
<!-- 指定hdfs的nameservice的名稱為nscluster，務必與core-site.xml中的邏輯名稱相同 -->
<property>
    <name>dfs.nameservices</name>
    <value>nscluster</value>
</property>    

<!-- 指定nscluster的兩個namenode的名稱，分別是nn1，nn2，注意后面的后綴.nscluster，這個是自定義的，如果邏輯名稱為nsc，則后綴為.nsc，下面一樣 -->
<property>
    <name>dfs.ha.namenodes.nscluster</name>
    <value>nn1,nn2</value>
</property>    

<!-- 配置nn1，nn2的rpc通信 端口    -->
<property>
    <name>dfs.namenode.rpc-address.nscluster.nn1</name>
    <value>master:9000</value>
</property>
<property>
    <name>dfs.namenode.rpc-address.nscluster.nn2</name>
    <value>data1:9000</value>
</property>    

<!-- 配置nn1，nn2的http訪問端口 -->
<property>
    <name>dfs.namenode.http-address.nscluster.nn1</name>
    <value>master:50070</value>
</property>
<property>
    <name>dfs.namenode.http-address.nscluster.nn2</name>
    <value>data1:50070</value>
</property>    

<!-- 指定namenode的元數據存儲在journalnode中的路徑 -->
<property>
    <name>dfs.namenode.shared.edits.dir</name>
    <value>qjournal://master:8485;data1:8485;data2:8485/nscluster</value>
</property>    

<!-- 開啟失敗故障自動轉移 -->
<property>
    <name>dfs.ha.automatic-failover.enabled</name>
    <value>true</value>
</property>     

<!-- 配置失敗自動切換的方式 -->
<property>
    <name>dfs.client.failover.proxy.provider.nscluster</name>
    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>    

<!-- 配置zookeeper地址，如果已經在core-site.xml中配置了，這里不是必須的 -->
<property>
    <name>ha.zookeeper.quorum</name>
    <value>master:2181,data1:2181,data2:2181</value>
</property>

<!-- 配置隔離機制 -->
<property>
    <name>dfs.ha.fencing.methods</name>
    <value>sshfence</value>
</property>

<!-- 指定秘鑰的位置 -->
<property>
    <name>dfs.ha.fencing.ssh.private-key-files</name>
    <value>/home/hadoop/.ssh/id_rsa</value>
</property>    

<!--配置sshfence隔離機制超時時間-->
<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
    <value>30000</value>
</property>

<!--保證數據恢復-->
<!--<property>
    <name>dfs.journalnode.http-address</name>
    <value>0.0.0.0:8480</value>
</property>-->
<!--<property>
    <name>dfs.journalnode.rpc-address</name>
    <value>0.0.0.0:8485</value>
</property> -->
</configuration>

3> mapred-site.xml

<configuration>
  <property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
</property>

<!--配置 MapReduce JobHistory Server 地址 ，默認端口10020-->
<property>
  <name>mapreduce.jobhistory.address</name>
  <value>0.0.0.0:10020</value>
</property>

<!--配置 MapReduce JobHistory Server web ui 地址， 默認端口19888-->
<property>
  <name>mapreduce.jobhistory.webapp.address</name>
  <value>0.0.0.0:19888</value>
</property>

<!--不用的數據節點，添加到excludes文件，之后執行hadoop dfsadmin -refreshNodes命令，-->
<!--協同hdfs-site.xml中的dfs.hosts.exclude屬性-->
<property>
    <name>mapred.hosts.exclude</name>
  <value>/usr/Apache/hadoop/etc/hadoop/excludes</value>
</property>

<property>
    <name>mapreduce.job.ubertask.enable</name>
    <value>true</value>
</property>

</configuration>

注意上面0.0.0.0:19888這種寫法，不能簡單的寫為19888，否則歷史服務器不能訪問

4> yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
<!--NodeManager上運行的附屬服務，需配置成mapreduce_shuffle才可運行MapReduce程序-->
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>

<!-- 開啟日志聚集功能 -->
<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>

<!-- 日志刪除時間 -1禁用，單位為秒 -->
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
</property>

<!--修改日志目錄hdfs://mycluster/var/log/hadoop-yarn/apps，當應用程序運行結束后，日志被轉移到的HDFS目錄（啟用日志聚集功能時有效）-->
<property>
    <name>yarn.nodemanager.remote-app-log-dir</name>
    <value>/logs</value>
</property>

<!-- yarn內存，配置nodemanager可用的資源內存 -->
<!--<property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>8192</value>
</property>-->

<!-- yarn  cpu，配置nodemanager可用的資源CPU -->
<!--<property>
    <name>yarn.nodemanager.resource.cpu-vcores</name>
    <value>8</value>
</property>-->

<!--以下為ha配置-->
<!-- 開啟yarn ha -->
<property>
  <name>yarn.resourcemanager.ha.enabled</name>
  <value>true</value>
</property>

<!-- 指定yarn ha的名稱 -->
<property>
  <name>yarn.resourcemanager.cluster-id</name>
  <value>nscluster-yarn</value>
</property>

<!--啟用自動故障轉移-->
<property>
    <name>yarn.resourcemanager.ha.automatic-failover.enabled</name>??
    <value>true</value>
</property>

<!-- resourcemanager的兩個名稱 -->
<property>
  <name>yarn.resourcemanager.ha.rm-ids</name>
  <value>rm1,rm2</value>
</property>

<!-- 配置rm1、rm2的主機  -->
<property>
  <name>yarn.resourcemanager.hostname.rm1</name>
  <value>master</value>
</property>
<property>
  <name>yarn.resourcemanager.hostname.rm2</name>
  <value>data1</value>
</property>

<!-- 配置yarn web訪問的端口 -->
<property>
  <name>yarn.resourcemanager.webapp.address.rm1</name>
  <value>master:8088</value>
</property>
<property>
  <name>yarn.resourcemanager.webapp.address.rm2</name>
  <value>data1:8088</value>
</property>

<!-- 配置zookeeper的地址 -->
<property>
  <name>yarn.resourcemanager.zk-address</name>
  <value>master:2181,data1:2181,data2:2181</value>
</property>

<!-- 配置zookeeper的存儲位置 -->
<property>
  <name>yarn.resourcemanager.zk-state-store.parent-path</name>
  <value>/rmstore</value>
</property>

<!--  yarn restart-->
<!-- 開啟resourcemanager restart -->
<property>
  <name>yarn.resourcemanager.recovery.enabled</name>
  <value>true</value>
</property>

<!-- 配置resourcemanager的狀態存儲到zookeeper中 -->
<property>
  <name>yarn.resourcemanager.store.class</name>
  <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>

<!-- 開啟nodemanager restart -->
<property>
  <name>yarn.nodemanager.recovery.enabled</name>
  <value>true</value>
</property>

<!-- 配置rpc的通信端口 -->
<property>
  <name>yarn.nodemanager.address</name>
  <value>0.0.0.0:45454</value>
</property>
<!--配置Web Application Proxy安全代理（防止yarn被攻擊）-->
<property>
<name>yarn.web-proxy.address</name>
<value>0.0.0.0:8888</value>
</property>

</configuration>

注意：

A. yarn.nodemanager.address這個屬性0.0.0.0:45454，在2.6的版本中不要只寫成45454，否則會導致nodemanager啟動不了

B. yarn.nodemanager.resource.memory-mb與yarn.nodemanager.resource.cpu-vcores這兩個屬性，可以默認，在目前的hadoop版本中，如果設置不當，會導致mapreduce程序呈現accepted但是不能run的狀態。在試驗中，2cpu，1G內存的配置就出現了這種情況。當設置為8cpu，8G內存時卻正常了，即使這不是機器的真實配置。針對這種情況，另一個解決方案是添加yarn.scheduler.minimum-allocation-mb這個屬性：

<property>
  <name>yarn.nodemanager.resource.memory-mb</name>
  <value>2200</value>
  <description>Amount of physical memory, in MB, that can be allocated for containers.</description>
</property>

<property>
  <name>yarn.scheduler.minimum-allocation-mb</name>
  <value>500</value>
</property>

由於資源問題而導致的這種情況可參考以下：

http://stackoverflow.com/questions/20200636/mapreduce-jobs-get-stuck-in-accepted-state

http://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.0.9.1/bk_installing_manually_book/content/rpm-chap1-11.html

http://zh.hortonworks.com/blog/how-to-plan-and-configure-yarn-in-hdp-2-0/

C. 如果日志設置不當，也會出現maprduce不能運行的情況。將yarn.log-aggregation-enable屬性設置為true，開啟日志聚集功能，則需要設置yarn.nodemanager.remote-app-log-dir屬性，即聚集后的日志存放的路徑。注意上面將屬性設置為/logs，標識的是在hdfs中的目錄（不需要自己建立，系統需要時自己會根據配置文件創建），而非本地。下圖顯示了程序運行后生成的日志：

5> hadoop-env.sh

設置一些重要的環境變量，設置內存的大小等，視情況而定

export JAVA_HOME=/usr/java/jdk
export HADOOP_PORTMAP_OPTS="-Xmx1024m $HADOOP_PORTMAP_OPTS"
export HADOOP_CLIENT_OPTS="-Xmx1024m $HADOOP_CLIENT_OPTS"
..............

6> 其他

在slaves文件中添加master，data1，data2三個名字，另外需要創建在配置文件中出現的一些目錄和文件：

etc/hadoop/excludes，hadoop2.6.5/data/nn，data/tmp，data/jn，data/dn，同時設置好這些文件的權限以及所有者和所屬組。

4、集群啟動

1> 確定啟動zookeeper

zkServer.sh start

2> 啟動journalnode，新安裝的需要三台機器分別啟動

hadoop-daemons.sh start journalnode

3> 啟動master的namenode

hadoop-daemon.sh start namenode

4> 同步data1的namenode

hdfs namenode -bootstrapStandby
hadoop-daemon.sh start namenode

在data1上執行以上命令后，master與data1節點此時仍然會是standby狀態

5> 格式化ZKFC，這一步可以提前運行，不是必須按此順序，但前提是開啟了zookeeper，並且在hadoop的配置文件中設置開啟了故障自動轉移

hdfs zkfc -formatZK

在master上運行即可。

6> 三台機器分別啟動datanode

hadoop-daemons.sh start datanode

7> 開啟zkfc，這時查看一下，dfs應該會正常啟動了，一般率先啟動zkfc的機器會作為active節點

hadoop-daemons.sh start zkfc

先在master上開啟，后在data1上開啟

8> 開啟yarn

start-yarh.sh
# 或者單獨啟動
yarn-daemon.sh start resourcemanager
yarn-daemon.sh start nodemanager

此處在master上運行start-yarh.sh，在data1上運行yarn-daemon.sh start resourcemanager，讓data1作為資源管理器的備選節點。

9> 其他

mr-jobhistory-daemon.sh start historyserver
yarn-daemon.sh start historyserver

開啟歷史服務器，此處在data1上運行

10> 結果

master

data1

data2

訪問192.168.1.215:50070

master處於active狀態

訪問192.168.1.218:50070

data1處於standby狀態

訪問192.168.1.215:8088

訪問192.168.1.218:8088

提示：This is standby RM. Redirecting to the current active RM: http://master:8088/cluster

最后進行測試，在任一機器上運行以下命令

yarn jar ~/c02mrtest.jar com.mr.test.MRWeb /TestData/webcount.txt /DataWorld/webresult5 128 1

運行結果：

附:常用命令

# journalnode
hadoop-daemons.sh start journalnode
hadoop-daemons.sh stop journalnode

# namenode
hadoop namenode -format 
hadoop-daemon.sh start namenode
hadoop-daemon.sh stop namenode

# 同步
hdfs namenode -bootstrapStandby
hadoop-daemon.sh start namenode

# datanode
hadoop-daemons.sh start datanode hadoop-daemons.sh stop datanode

# zookeeper以及zkfc
zkServer.sh start
zkServer.sh stop
hdfs zkfc -formatZK
hadoop-daemons.sh start zkfc
hadoop-daemons.sh stop zkfc

# yarn
yarn-daemon.sh start resourcemanager
yarn-daemon.sh stop resourcemanager
yarn-daemon.sh start nodemanager
yarn-daemon.sh stop nodemanager
yarn-daemon.sh start proxyserver
yarn-daemon.sh stop proxyserver
mr-jobhistory-daemon.sh start historyserver
mr-jobhistory-daemon.sh stop historyserver
yarn-daemon.sh start historyserver
yarn-daemon.sh stop historyserver
# rm1 rm2為配置文件中設定的資源管理器名稱
yarn rmadmin -getServiceState rm1 
yarn rmadmin -getServiceState rm2 

start-dfs.sh
stop-dfs.sh
start-yarn.sh
stop-yarn.sh

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Zookeeper + Hadoop2.6 集群HA + spark1.6完整搭建與所有參數解析 Hadoop HA 高可用集群搭建 hadoop搭建HA集群之后不能自動切換namenode Hadoop2.7.3 HA高可靠性集群搭建 hadoop在zookeeper上的高可用HA 七、Hadoop3.3.1 HA 高可用集群QJM （基於Zookeeper，NameNode高可用+Yarn高可用） hadoop HA+Federation（高可用聯邦）搭建配置（一）搭建hadoop2.6.0 HA及YARN HA hadoop 集群HA高可用搭建以及問題解決方案搭建hadoop集群的免密鑰登錄配置