Hadoop——集群參數配置詳解


  

一、配置文件

在hadoop集群中,需要配置的文件主要包括四個,分別是core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml,

這四個文件分別是對不同組件的配置參數,主要內容如下表所示:

 

二、配置時重要參數

1、core-site.xml

2、hdfs-site.xml

3、mapred-site.xml

4、yarn-site.xml

 

三、搭建集群配置樣例

1、core-site.xml

<configuration>
<property>
    <name>fs.defaultFS</name>
    <value>hdfs://cloud01:9000</value>
</property>

<property>
    <name>io.file.buffer.size</name>
    <value>131072</value>
</property>

<property>
    <name>hadoop.tmp.dir</name>
    <value>file:/home/hduser/tmp</value>
</property>
</configuration>

2、hdfs-site.xml

<configuration>
<property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>cloud01:9001</value>
</property>

<property>
    <name>dfs.namenode.name.dir</name>
    <value>file://${hadoop.tmp.dir}/dfs/name</value>
</property>

<property>
    <name>dfs.datanode.data.dir</name>
    <value>file://${hadoop.tmp.dir}/dfs/data</value>
</property>

  <property>
    <name>dfs.namenode.checkpoint.dir</name>
    <value>file://${hadoop.tmp.dir}/dfs/namesecondary</value>
  </property>

<property>
    <name>dfs.replication</name>
    <value>3</value>
</property>

<property>
    <name>dfs.webhdfs.enabled</name>
    <value>true</value>
</property>
</configuration>

3、mapred-site.xml

<configuration>
<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>

<property>
    <name>mapreduce.jobhistory.address</name>
    <value>cloud01:10020</value>
</property>

<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>cloud01:19888</value>
</property>
</configuration>

4、yarn-site.xml

<configuration>
<property>
  <name>yarn.nodemanager.aux-services</name>
  <value>mapreduce_shuffle</value>
</property>

<property>
  <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
  <value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>

<property>
  <name>yarn.resourcemanager.address</name>
  <value>cloud01:8132</value>
</property>

<property>
  <name>yarn.resourcemanager.scheduler.address</name>
  <value>cloud01:8130</value>
</property>

<property>
  <name>yarn.resourcemanager.resource-tracker.address</name>
  <value> cloud01:8131</value>
</property>

<property>
  <name>yarn.resourcemanager.admin.address</name>
  <value> cloud01:8133</value>
</property>

<property>
  <name>yarn.resourcemanager.webapp.address</name>
  <value>cloud01:8188</value>
</property>
</configuration>

 

四、更多配置參數信息

1、官方網址查詢

通過這些網址,可以了解最新的全部的hadoop 配置信息,而且包括一些過時的定義標識,從而更好地維護您的集群。

2、集群工具查詢

集群配置好后,可以通過,查看集群參數狀況,其中192.168.75.101為yarn.resourcemanager.webapp.address配置項的地址,8188為該配置項設置的端口。

 

 

引用:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM