在window系統開發程序時,遠程linux服務器上的hadoop速度很慢,影響開發效率,能不能在本地搭建hadoop環境的?答案肯定的,且看下文如何在window上部署hadoop;
(源文地址:https://www.cnblogs.com/lfhappy/p/11482195.html)
1、下載hadoop(建議下載穩定版本):http://mirror.bit.edu.cn/apache/hadoop/common/stable/
2、hadoop需要JDK,如果已經安裝,跳過此步驟,還沒有,需要安裝JDK-->配置JAVA_HOME
3、解壓下載好的hadoop安裝包到指定的位置。
==》沒有JKD則會報異常: Caused by: java.io.FileNotFoundException: HADOOP_HOME and hadoop.home.dir are unset.
4、GitHub上下了個3.1的winutils.exe,鏈接https://github.com/s911415/apache-hadoop-3.1.0-winutils/blob/master/bin/hadoop.dll覆蓋原bin目錄下面的內容即可
5、配置信息
==>首先配置環境變量HADOOP_HOME:[安裝位置],再配置系統變量path中添加%HADOOP_HOME%\bin
5.1 hadoop-env.sh
修改JDK的路徑
@rem The java implementation to use. Required.
set JAVA_HOME=D:\Java\JDK1.8
5.2 mapred-site.xml --配置調度框架名稱
1 <configuration> 2 <property> 3 <name>mapreduce.framework.name</name> 4 <value>yarn</value> 5 </property> 6 </configuration>
5.3 core-site.xml--配置NameNode訪問名字
1 <configuration> 2 <property> 3 <name>fs.default.name</name> 4 <value>hdfs://localhost:9001</value> 5 </property> 6 </configuration>
5.4 hdfs-site.xml--分布式系統高可用配置
1 <configuration> 2 <property> 3 <name>dfs.replication</name> 4 <value>1</value> 5 </property> 6 <property> 7 <name>dfs.namenode.name.dir</name> 8 <value>../dfs/name</value> 9 </property> 10 <property> 11 <name>dfs.datanode.data.dir</name> 12 <value>../dfs/data</value> 13 </property> 14 </configuration> 15 <!--注釋不用復制 16 * dfs.namenode.name.dir,dfs.datanode.data.dir 17 必須重新配置,否則搭建成功后,下次重新運行直接報錯,因為默認數據文件都是放置在tmp目錄下,這個目錄中文件會在服務器關閉情況下刪除 18 * 路徑從bin當前目錄下開始算起.寫先對路徑,或者以“/”開頭寫絕對路徑 19 -->
5.5 yarn-site.xml
1 <configuration> 2 <!-- Site specific YARN configuration properties --> 3 <property> 4 <name>yarn.nodemanager.aux-services</name> 5 <value>mapreduce_shuffle</value> 6 </property> 7 </configuration>
說明window下hadoop部署成功
注:在本地不需要啟動hadoop。
7、本地如果需要啟動hadoop
1.運行cmd窗口,切換到hadoop的bin目錄執行hdfs namenode -format。
2.運行cmd窗口,切換到hadoop的sbin目錄,執行start-all.cmd。

