章節:
第一章節:CentOS 7 配置hadoop(一) 安裝虛擬機(偽分布)
第二章節:CentOS 7 配置hadoop(二) 配置hdfs(偽分布)
第三章節:CentOS 7 配置hadoop(三) 配置hbase(偽分布)
第四章節:CentOS 7 配置hadoop(四) 配置hive(偽分布)
第五章節:CentOS 7 配置hadoop(五) 配置sqoop(偽分布)
第六章節:CentOS 7 配置hadoop(六) 配置flume(偽分布)
第二章CentOS 7 配置hadoop(二) 配置hdfs(偽分布)
准備 hadoop 2.6 、jdk 1.8 所需內容在第一章節 CentOS 7 配置hadoop(一) 安裝虛擬機
(二) 配置hdfs
續上一章登錄之后
1.修改主機名
在CentOS 7中,我們可以通過hostname命令查看當前的主機名。
我們可以通過命令“hostnamectl set-hostname 主機名”來永久修改主機名。
2.配置靜態IP地址
vi /etc/sysconfig/network-scripts/ifcfg-ens33
這里的紅框內是在下面的NAT 設置的網絡 網關 子網,其中 IPADDR 要和NAT 設置的 網關IP前三段一致 ,后一段不一樣就可以
打開編輯,點擊虛擬網絡編輯器
注意IP的設置
設置完記得service network restart
查看IP 指令為 ip addr
3.關閉防火牆
關閉防火牆:systemctl disable firewalld
查看防火牆:systemctl status firewalld
4.生成SSH公鑰 ssh-keygen -t rsa (遇見問題直接回車)
在mster的終端下輸入
ssh localhost
連接本機還需要輸入密碼,因此我們,還需要設置master與本機的無密碼連接,配置如下:
cd ~/.ssh
cat ./id_rsa.pub >> ./authorized_keys
再次輸入 ssh localhost 就不需要輸入密碼而直接與本機連接。
重啟虛擬機
5.使用 xshell工具
點擊鏈接輸入用戶名密碼
6.鏈接FileZilla
7.使用FileZilla上傳文件到虛擬機 右鍵上傳
8.上傳完畢到xshell工具里解壓兩個tar壓縮包 命令 tar -xzvf 壓縮包名
9.解壓完成配置環境變量 vi /etc/profile
export JAVA_HOME=/root/jdk1.8.0_161
export PATH=$PATH:$JAVA_HOME/bin
export HADOOP_HOME=/root/hadoop-2.6.0-cdh5.7.0
export PATH=$PATH:$HADOOP_HOME/bin
配置完環境變量記得 source /etc/profile
10.配置hadoop 先進入 cd /root/hadoop-2.6.0-cdh5.7.0/etc/hadoop 文件目錄下
1)修改hadoop-env.sh 文件
export JAVA_HOME=/root/jdk1.8.0_161
export HADOOP_HOME=/root/hadoop-2.6.0-cdh5.7.0
2)修改core-site.xml 文件
<property>
<name>fs.default.name</name>
<value>hdfs://master:8020</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hdfs/tmp</value>
</property>
3)修改hdfs-site.xml文件
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>/root/data/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/root/data/data</value>
</property>
4)修改mapred-site.xml文件 要先執行cp 命令(cp mapred-site.xml.template mapred-site.xml)
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
5)修改yarn-site.xml文件
<property>
<name>yarn.resourcemanager.address</name>
<value>master:8080</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master:8082</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
6)修改slaves 文件
寫入主機名(master)
11 格式化hdfs 命令hadoop namenode -format
12 啟動hdfs 進入到 cd /root/hadoop-2.6.0-cdh5.7.0/sbin/ 執行啟動命令 ./start-all.sh 關閉命令 ./stop-all.sh
輸入jps
如果不足六個
關閉 hadoop 命令 ./stop-all.sh
需要在 vi /etc/hosts 文件添加 主機名
需要在 vi /etc/sysconfig/network 添加 HOSTNAME=master
刪除 rm -rf /root/data /opt/hdfs (/root/data是你在修改hdfs-site.xml文件 的地址 /opt/hdfs是你在修改core-site.xml 文件 的地址)
執行 hadoop namenode -format 格式化 之后再次啟動 hadoop就可以了 (啟動命令./start-all.sh)