1. 配置 hadoop
-
依賴:
JDK
1、解壓 hadoop
到 F:\software\hadoop-2.7.1
,配置文件位置:F:\software\hadoop-2.7.1\etc\hadoop
2、core-site.xml
(配置默認hdfs
的訪問端口),新建 tmp
目錄:
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/F:/software/hadoop-2.7.1/tmp</value>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
3、hdfs-site.xml
(設置復制數為1,即不進行復制。namenode
文件路徑以及datanode
數據路徑),新建 namenode、datanode
目錄:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value> <!-- 這個參數設置為1,因為是單機版hadoop -->
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/F:/software/hadoop-2.7.1/data/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/F:/software/hadoop-2.7.1/data/datanode</value>
</property>
</configuration>
4、將mapred-site.xml.template
名稱修改為 mapred-site.xml
后再修改內容(設置mr
使用的框架,這里使用yarn
):
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapred.job.tracker</name>
<value>hdfs://localhost:9001</value>
</property>
</configuration>
5、yarn-site.xml
(這里yarn
設置使用了mr
混洗):
<configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>
6、hadoop-env.cmd
,設置JAVA_HOME
的值:
set JAVA_HOME=C:\Program Files\Java\jdk1.8.0_261
# 或者 C:\PROGRA~1 表示 C:\Program Files
set JAVA_HOME=C:\PROGRA~1\Java\jdk1.8.0_261
7、將 bin/hadoop.dll
拷貝到 C:\Windows\System32
,沒有則從 winutils 下載對應版本
2. 啟動
1、bin
目錄,格式化 hdfs
:
hadoop namenode -format
2、sbin
目錄:
start-all.cmd
# 停止
stop-all.cmd
3、查看進程:
F:\software\hadoop-2.7.1\sbin>jps
2752 NameNode
11668 ResourceManager
5284 Jps
8504 DataNode
4、在瀏覽器地址欄中輸入:http://localhost:8088
查看集群狀態。
5、在瀏覽器地址欄中輸入:http://localhost:50070
查看 Hadoop
狀態
參考文章
https://www.cnblogs.com/chevin/p/9090683.html
3. 搭建 hbase
如果啟動 hbase
時, HMaster
進程總是掉線,可以考慮將 hadoop/bin
中文件替換為 hadooponwindows-master/bin
hadoop
與 hbase
版本對應關系:https://www.pianshen.com/article/887057118/
下載地址:
1、下載解壓 hadoop-2.7.1、hbase-1.2.2
2、添加 hadoop/bin、sbin、hbase/bin
到環境變量
3、修改 hbase-env.cmd
:
set JAVA_HOME=C:\PROGRA~1\Java\jdk1.8.0_261
set HBASE_MANAGES_ZK=false
4、修改 hbase-site.xml
,hbase-1.2.2
目錄新建 hbdata/root、zoo、tmp
三個目錄:
<configuration>
<property>
<name>hbase.master</name>
<value>localhost</value>
</property>
<property>
<name>hbase.rootdir</name>
<value>file:///F:/software/hadoop-hbase-test/hbase-1.2.2/hbdata/root</value>
</property>
<property>
<name>hbase.tmp.dir</name>
<value>F:/software/hadoop-hbase-test/hbase-1.2.2/hbdata/tmp</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>localhost</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>F:/software/hadoop-hbase-test/hbase-1.2.2/hbdata/zoo</value>
</property>
<!-- 外部ZK此處必須為true,不然hbase仍用自帶的zk,若啟動了外部的zookeeper,會導致沖突,hbase啟動不起來 -->
<property>
<name>hbase.cluster.distributed</name>
<value>false</value>
</property>
<!-- HMaster UI端口 -->
<property>
<name>hbase.master.info.port</name>
<value>61510</value>
</property>
</configuration>
5、將 winutils.exe、hadoop.dll
拷貝到 hadoop-2.7.1\bin
目錄中,再將 hadoop.dll
拷貝到 C:\Windows\System32
目錄中
6、啟動 hbase
:
cd F:\software\hadoop-hbase-test\hbase-1.2.2\bin
start-hbase.cmd
7、瀏覽器訪問:http://127.0.0.1:61510/
參考文章:
- https://blog.csdn.net/liyongke89/article/details/81744566
- https://blog.csdn.net/a2099948768/article/details/79577246
- https://www.jianshu.com/p/dae6337790da
- http://www.blogjava.net/anchor110/articles/424888.html
- https://www.cnblogs.com/chevin/p/9090683.html
- https://blog.csdn.net/chinuoye3292/article/details/100797570
- https://www.cnblogs.com/taoweizhong/p/10526999.html