一. 介紹
HBase是一個分布式的、面向列的開源數據庫,源於google的一篇論文《bigtable:一個結構化數據的分布式存儲系統》。HBase是Google Bigtable的開源實現,它利用Hadoop HDFS作為其文件存儲系統,利用Hadoop MapReduce來處理HBase中的海量數據,利用Zookeeper作為協同服務。
HBase以表的形式存儲數據。表有行和列組成。列划分為若干個列族/列簇(column family)。
如上圖所示,key1, key2, key3是三條記錄的唯一的row key值,column-family1, column-family2, column-family3是三個列族,每個列族下又包括幾列。比如 column-family1這個列族下包括兩列,名字是column1和column2。t1:abc,t2:gdxdf是由row key1和column-family1-column1唯一確定的一個單元cell。這個cell中有兩個數據,abc和gdxdf。兩個值的時間戳不一樣,分別是t1,t2, hbase會返回最新時間的值給請求者。
二. 安裝
下載HBase最新版本,放到合適的目錄,比如/usr/local 或 /opt
之后解壓
tar -zxvf hbase-x.y.z tar.gz
三. 命令行操作
進入解壓后的目錄,開啟hbase,啟動hbase shell
bin/start-hbase.sh bin/hbase shell
輸入 help 可以看到命令分組
部分命令清單
下邊分組舉例
general操作
查詢服務器狀態 status
查詢hbase版本 version
ddl操作
1. 創建一個表
create 'table1', 'tab1_id', 'tab1_add', 'tab1_info'
2. 列出所有的表
list
3. 獲得表的描述
describe "table1"
4. 刪除一個列族 disable alter enable
disable 'table1' alter 'table1', {NAME=>'tab1_add', METHOD=>'delete'} enable 'table1'
5. 查看表是否存在
exists 'table2'
6. 判斷表是否為‘enable’
is_enabled 'table1'
判斷表是否為‘disable’
is_disabled 'table1'
7. 刪除一個表
disable 'table1' drop 'table1'
dml操作
1. 插入幾條記錄
put 'member', 'scutshuxue', 'info:age', '24' put 'member', 'scutshuxue', 'info:birthday', '1987-06-17' put 'member', 'scutshuxue', 'info:company', 'alibaba' put 'member', 'scutshuxue', 'address:contry', 'china' put 'member', 'scutshuxue', 'address:province', 'zhejiang' put 'member', 'scutshuxue', 'address:city', 'hangzhou'
2. 全表掃描 scan
3. 獲得數據 get
3.1 獲得一行的所有數據
3.2 獲得某行,某列族的所有數據
3.3 獲得某行,某列族,某列的所有數據
4. 更新一條記錄 put(把scutshuxue年齡改為99)
put 'member', 'scutshuxue', 'info:age', 99
5. 刪除 delete、 deleteall
5.1 (刪除行'scutshuxue', 列族為‘info' 中age的值
delete 'member', 'scutshuxue', 'info:age'
5.2 刪除整行
deleteall 'member', 'scutshuxue'
6. 查詢表中有多少行
count 'member'
7. 給‘xiaoming’這個id增加'info:age'字段,並使用counter實現遞增
incr 'member', 'xiaoming', 'info:age'
8. 將整個表清空
truncate 'member'
tools操作
1. 創建一個表
四. 參考