安裝之前 - 檢查必要條件
安裝之前 - 檢查必要條件
(1) Java (需要安裝1.6.x及其以上版本)
在終端輸入 java -version
來查看你機子上的 Java 版本;
(2) Hadoop
需要注意的是偽分布模式下,HBase 的版本需要和 Hadoop版本 匹配
,不然很可能容易出錯。你可以在HBase的lib目錄下看到對應的Hadoop的Jar文件版本。
在這里,我們使用了Hadoop V2.4.1版本以及HBase V0.98.11版本。
(3) SSH
SSH的安裝。SSH用來管理遠程Hadoop和HBase守護進程。
本實驗環境下,為了大家的方便,我們已經為大家准備好了這些必要條件,你只需要專注於HBase的安裝配置即可。
三、安裝進行時 - 安裝和配置HBase
確認上面的條件我們都准備好了之后,就可以開始安裝HBase了。實驗開始前,你應該切換到 hadoop 用戶:
$ su hadoop
HBase的安裝通常分為3種模式:
1. 單機模式 安裝
(1)下載和解壓
單機模式的安裝非常簡單,幾乎不用對安裝文件做什么修改就可以使用。單機模式下,HBase並不使用HDFS,因此將安裝文件解壓后就幾乎可以直接運行。輸入命令下載HBase:
$ wget
http:/
/labfile.oss.aliyuncs.com/hbase-
0.
98.11-hadoop2-bin.tar.gz
再將其壓縮包解壓:
$ tar zxvf hbase-
0.
98.11-hadoop2-bin.tar.gz
由於解壓出來的文件名可能很長,建議修改為較短文件名,例如:
$ mv hbase-
0.
98.11-hadoop2 hbase
(2)配置 hbase-site.xml
在運行之前,我們需要對HBase進行相關配置。建議大家修改 ${HBase-Dir}/conf/hbase-site.xml 文件,因為即使你修改了hbase-default.xml文件,也會被hbase-site.xml中的配置所覆蓋。也就是說,最終是以 hbase-site.xml 中的配置為准的。我們做如下修改:
<configuration>
<property>
<name>hbase.rootdir
</name>
<value>file:///tmp/hbase-${user.name}/hbase
</value>
</property>
</configuration>
注意:修改 ${user.name}
為你自己的 hadoop 用戶名
2. 偽分布模式 安裝
偽分布模式是一個運行在單台機器上的分布式模式。此模式下,HBase所有的守護進程將運行在同一個節點之上,而且需要依賴HDFS,因此在此之前必須保證HDFS已經成功運行,確認無誤后,我們就可以開始配置HBase的參數了。
(1)配置 hbase-site.xml 文件
<configuration>
<property>
<name>hbase.rootdir
</name>
<value>hdfs://localhost:9000/hbase
</value>
</property>
<property>
<name>hbase.cluster.distributed
</name>
<value>true
</value>
</property>
</configuration>
hbase.rootdir:該參數制定了HReion服務器的位置,即數據存放的位置。主要端口號要和Hadoop相應配置一致。hbase.cluster.distributed:HBase的運行模式。false是單機模式,true是分布式模式。若為false, HBase和Zookeeper會運行在同一個JVM里面。默認為false.
(2)設置環境變量
另外,我們需要設置一些環境變量。修改HBase下的conf目錄中的hbase-env.sh文件(你的jdk路徑可能不一樣):
export JAVA_HOME=/usr/
local/jdk1.7.0_67
export HBASE_MANAGES_ZK=
true
export HBASE_MANAGES_ZK=true
此配置信息,表示設置由hbase自己管理zookeeper,不需要單獨的zookeeper, 本文搭建的 Hbase 用的是自帶的 zookeeper,故設置為true.
最后修改添加PATH, 則輸入:
$ sudo vim /etc/profile
來修改 /etc/profile 文件:
# set hbase path
export PATH=$PATH
:/usr/local/hadoop/hbase/bin
3. 完全分布模式 安裝
由於完全分布模式需要多台機器,在這里我們就不給出演示了。
四、安裝之后 - 運行和停止 HBase
正如上面我們提到的,HBase安裝分為3個模式,因此HBase的運行自然也分為同樣的3個模式。
1. 單機模式 運行
(1)啟動
單機模式下不需要HDFS,因此不需要事先啟動Hadoop,直接啟動HBase即可。終端下輸入命令:./start-hbase.sh
注意:路徑要正確,應為:$HBASE_HOME/bin 目錄,否則會找不到 start-hbase.sh 這個文件,就會出現錯誤
(2)查看進程
我們可以通過 jps
來查看當前 HBase 的進程:
(3)停止 HBase 服務
輸入 ./stop-hbase.sh
2. 偽分布模式 運行
(1)啟動和查看進程
前面我們提到過,偽分布模式下,必須先確保 HDFS 已經啟動。因此,我們先啟動 HDFS,輸入命令: ./start-all.sh
使用 jps
查看目前 Hadoop 的進程:
HDFS 成功啟動之后,我們再啟動 HBase,這里和單機模式下啟動 HBase 的方法一樣,輸入命令: ./start-hbase.sh
:
此時再使用 jps
查看,可以看到多了HBase的相關進程:
(2)進入 HBase Shell
通過HBase Shell用戶可以方便地創建、刪除以及修改表,還可以向表中添加數據、列出表中的相關相信等。
輸入 help
來查看其所支持的命令,可以根據自己的需要選擇。
(3)停止 HBase
根據依賴關系,我們需要先關閉HBase, ./stop-hbase.sh
:
通過 jps
可以看到,HBase相關的進程沒有了:
再關閉HDFS, ./stop-all.sh
.
最后,再通過 jps
發現 HDFS 的進程也沒有了: