Phoenix實現用SQL查詢HBase

本文轉載自查看原文 2014-12-02 12:41 89166 HADOOP/ PHOENIX/ Hadoop/ NOSQL/ APACHE/ SQL/ HBase

博客已轉移，請借一步說話，http://www.daniubiji.cn/archives/111

HBase，一個NoSQL數據庫，可存儲大量非關系型數據。

HBase，可以用HBase shell進行操作，也可以用HBase Java api進行操作。HBase雖然是一個數據庫，但是它的查詢語句，很不太好用。要是能像使用Mysql等關系型數據庫一樣用sql語句操作HBase，那就很Perfect了。

現有工具有很多Hive，Tez，Impala，Shark/Spark，Phoenix等。今天主要記錄Phoenix。

phoenix，由saleforce.com開源的一個項目，后又捐給了Apache。它相當於一個Java中間件，幫助開發者，像使用jdbc訪問關系型數據庫一些，訪問NoSql數據庫HBase。

phoenix，操作的表及數據，存儲在hbase上。phoenix只是需要和Hbase進行表關聯起來。然后再用工具進行一些讀或寫操作。

其實，可以把Phoenix只看成一種代替HBase的語法的一個工具。雖然可以用java可以用jdbc來連接phoenix，然后操作HBase，但是在生產環境中，不可以用在OLTP中。在線事務處理的環境中，需要低延遲，而Phoenix在查詢HBase時，雖然做了一些優化，但延遲還是不小。所以依然是用在OLAT中，再將結果返回存儲下來。

Phoenix官網上，對Phoenix講解已經很屌了。如果英語好，可以看官網，更正式一些。

Phoenix安裝

1、下載phoenix。

phoenix與HBase版本對應關系

Phoenix 2.x - HBase 0.94.x

Phoenix 3.x - HBase 0.94.x

Phoenix 4.x - HBase 0.98.1+

我目前測試使用版本概況：

Hadoop1.0.4

HBase0.94.18

所以我可以用phoenix2.x，phoenix3.x。

官網download頁面有

我選用的是phoenix3.1.0版本。

2、上傳到主節點linux就ok了，解壓縮

tar –zxvf phoenix.tar.gz

pwd

/root/phoenix

ll phoenix

phoenix目錄結構可能會有點不同，主要是bin目錄的位置，可能在hadoop1下，也可能直接在 /root/phoenix下。沒關系，都差不多。

3、拷貝一些文件

既然用的hadoop1.x集群，那么我們使用phoenix目錄下，hadoop1目錄下的內容。

①將hadoop1下，phoenix-core-3.x.jar拷貝到hadoop集群各個節點HBase的lib目錄下。

②重啟一下HBase

4、驗證是否安成功

在主節點上，切換到/root/phoenix/hadoop1/bin目錄下

輸入 ./sqlline.py master:2181

如果出現這個畫面，那就是成功了。如果不成功，可能是zookeeper配置的有一些問題吧。

好吧，先退出此界面，輸入!quit回車然后就可以退出了。

這個phoenix挺有意思，有一些命令需要輸入嘆號的！

phoenix的使用

mysql的話，可以CLI命令行的方式操作；可以通過用jdbc，在Java代碼中訪問；可以通過用SQLyog進行訪問管理；

phoenix，怎么用呢？~可以看成是mysql。Phoenix可以在CLI下操作；可以用jdbc操作；可以用phoenix的一個客戶端工具Squirrel 訪問；

先說Squirrel吧，這個簡單一些。

Squirrel SQL Client，是一個連接數據庫的客戶端工具。一般支持JDBC的數據庫都可以用它來連接。（如Squirrel連接Mysql）

下載Squirrel SQL Client，解壓縮就可以了。運行squirrel-sql.bat就出現了圖形界面。

這肯定要說怎樣連Phoenix？

①在Squirrel安裝目錄的lib下，添加幾個jar包

a,phoenix-core-xxx.jar

b,phoenix-3.0-client.jar

c,hbase-0.94.18.jar

d,hadoop1.0.4.jar

e,hadoop-common-xxx.jar

②

需要點擊“Drivers”，將phoenix的驅動添加進去。

③點擊左上角藍色的 “ + ” 加號，添加

按上面的順序，依次填寫。第一步Name：隨便寫個名字，標記連接；第二步Example URL：相當於mysql的jdbc連接串，這里的alias寫zookeeper的主機名稱，端口號，可以寫，可以不寫，我一般不寫；第三步選擇Phoenix-core的jar包；第四步就是手動輸入org.apache.phoenix.jdbc.PhoenixDriver。

然后點擊OK。

④配置連接

Name：為隨便起的名稱。

Driver：選中③中添加的phoenix驅動。

URL：寫如上內容，jdbc:phoenix:node1,node2,master等這里主要是zookeeper主機名。

User Name：要連接的主機的用戶名

Password：要連接的主機的密碼

點擊Test可以進行測試，或點OK連接。

連接完畢，啟動后，就可以看到如下的效果了。這里我已經創建了幾個表了，這些表都是存在於HBase上的。

Squirrel的一些布局簡介：

1，用squirrel建立的一些連接

2，當前連接下，所有對象，包括主見系統表，普通表，視圖。

3，為表，這些表都是實際存在於zookeeper所管理的HBase上的。右鍵此表，可以對表進行管理。

4，為視圖。

5，編寫sql腳本的地方，可以輸入腳本執行。腳本執行方式，在5上面有一個小人，選中sql，點擊小人就可以執行了。或者按ctrl + enter鍵，執行。

6，為選中的對象的一些基本信息，列信息，行數等。

7，為sql執行的一些狀態。

下面在Squirrel中創建一個表

在Squirrel中創建表的過程主要是編寫sql，進行執行。sql該怎么寫，需要看phoenix驅動都支持什么效果。

這需要看phoenix的官網了。

需要注意的是phoenix是區分大小寫的，自己定義的HBase中的 HTableName，ColumnFamily，以及字段Column，需要和Phoenix中保持一致。

phoenix操作hbase，我們有兩種方式，創建表，創建視圖。

這兩種方式，有區別。

比如，創建表的話，就可以對HBase進行插入，查詢，刪除操作。視圖的話，一般就只可以進行查詢操作

雖然看起來，表的功能，比視圖更強大一些。但是就像是mysql等關系型數據庫一樣，刪除表操作，會將表刪掉。但是刪除視圖操作，卻不會影響原始表的結構。

因為使用phoenix，創建表后，會自動和hbase建立關聯映射。當你使用phoenix刪除和hbase之間的關系時，就會將hbase中的表也刪掉了

所以用視圖，會對原始的HBase表影響小一些。

phoenix可以創建表，

若hbase中，不存在HTable：

create htablename (

pk VARCHAR primary key not null,

col1 VARCHAR null,

col2 VARCHAR null,

col3 VARCHAR null

)

create htablename2(

pk VARCHAR primary key null,

"cf"."col1" VARCHAR null,

"cf"."col2" VARCHAR null,

"cf2"."col3" VARCHAR null,

"cf2"."col4" VARCHAR null,

)

上面的SQL腳本，可以在SQuirreL中進行執行，執行過程中，如果出現錯誤，會在工具的下面進行提示。若成功后，就可以在HBase中看到這個表了。

若Hbase中，已存在名為htablename3的HTable，那么SQuirrel是不會直接顯示出hbase中這個已存在的表的，我們還需要額外做一些操作。

在SQuirreL中進行執行，執行完畢后，就會將HBase的htablename3，映射到SQuirreL中。這樣我們就可以在Java api中進行操作了。否則是不可以的。

那么需要哪些具體操作呢？其實很簡單，我當時沒想到

就像創建表一樣，使用Create table就可以了。就這樣簡單。

不過這個語句怎么寫呢？怎樣對應呢？

create htablename3(

pk VARCHAR primary key null, -------這句話直接寫就可以了，這樣的話，HBase中的RowKey轉換成phoenix中的主鍵，列名就叫 pk。rowkey自動會和primary key進行對應。

"cf"."col1" VARCHAR null, -------將名為cf的columnFamily下，字段名為col1的字段，寫在這里。

"cf"."col2" VARCHAR null, -------將名為cf的columnFamily下，字段名為col2的字段，寫在這里。。。下面就以此類推

"cf2"."col3" VARCHAR null,

"cf2"."col4" VARCHAR null,

)

然后在SQuirreL中執行，然后就可以看到數據了。

不過此時，可能還會有問題，亂碼。在SQuirrel中，主鍵以及一些包含漢字的字段，都是方塊等亂碼了。這個怎么解決？？？

創建試圖

CREATE VIEW "heihei"

(pk VARCHAR primary key)

default_column_family = 'FM'

創建完成后，這里的“heihei” 是HBase中table的名稱。然后定義一個主鍵，就可以了。

創建視圖

①CREATE VIEW "DAMAI" ( PK VARCHAR PRIMARY KEY) DEFAULT_COLUMN_FAMILY='FM'

這里雙引號內的 “DAMAI” 和HBase中的表名是一樣的，所以會自動關聯。

那么，如果想針對HBase中的一個表，建多個視圖呢？

②第二種視圖，可以在Phoenix table的基礎上創建。

CREATE VIEW my_VIEW (new_col VARCHAR,new_col2 VARCHAR) AS SELECT * FROM phoenix_Table WHERE ......

③第三種視圖，是建立在視圖之上，

CREATE VIEW my_VIEW_ON_VIEW AS SELECT * FROM MY_VIEW WHERE ......

所以說，在創建DAMAI視圖的時候，可以將全部字段都包括進來。然后再在此視圖基礎上，創建其它視圖。

隨着數據的增長，視圖中可以看到的數據的條數，也在同步增加。

使用命令查看一下視圖中的數據

select * from damai 這時可以用大小寫都行了。沒有區分

查詢結果現在，只有一列。看來是創建視圖時，沒有關聯好其他列。沒關系，刪掉，重建。

Phoenix中的語法

Phoenix中的數據類型

Phoenix中的方法

我自己使用過程中一些簡單語句，如下：

select * from shuju;

select count(1) from shuju;

select cmtid,count(1) as num from shuju group by cmtid order by num desc;

select avg(TO_NUMBER(avgt)) from shuju;

select cmtid,count(1) as num,avg(TO_NUMBER(avgt)) as avgt,avg(TO_NUMBER(loss)) as loss from shuju group by cmtid order by num desc;

select acm,dtype,cmtid,count(1) as num,avg(TO_NUMBER(avgt)) as avgt,avg(TO_NUMBER(loss)) as loss

from shuju

group by acm,dtype,cmtid

order by num desc;

select acm,dtype,porgcode,orgid,cmtid,count(1) as num,avg(TO_NUMBER(avgt)) as avgt,avg(TO_NUMBER(loss)) as loss

from shuju

group by acm,dtype,porgcode,orgid,cmtid

order by num desc;

where TO_DATE(ttime,'yyyyMMddHHmmss')=TO_DATE('20141125','yyyyMMdd')

select ttime from shuju order by ttime desc;

where TO_DATE(ttime,'yyyyMMddHHmmss')=TO_DATE('20141125','yyyyMMdd')

select TO_DATE(ttime,'yyyyMMddHHmmss') from shuju;

select TO_DATE('20141125','yyyyMMdd') from shuju;

select (TO_DATE(ttime,'yyyyMMddHHmmss')=TO_DATE('20141125','yyyyMMdd')) as aaa from shuju order by aaa asc;

用SHELL命令來操作phoenix

用SHELL來操作phoenix，不太好用。無助的時候，你可以喊救命！So,Say Help Help Help

./sqlline.py master:2181

進入shell后，輸入help

可以看到很多命令，前面都帶了一個嘆號。根據意思自己猜一猜功能，然后試一試效果，就可以了。不記錄了。

用Phoenix Java api操作HBase

這個過程就想是JDBC一樣使用就可以了。

①先將phoenix的 core.jar包和 phoenix的client.jar 包放到lib里。

②創建連接，過程和mysql類似

public Connection GetConnection(){
Connection cc = null;
String driver = "org.apache.phoenix.jdbc.PhoenixDriver";
//String url = "jdbc:phoenix:192.168.206.21:2181";

try {
Class.forName(driver);
} catch (ClassNotFoundException e) {
e.printStackTrace();
}

if (cc == null) {
try {
cc = DriverManager.getConnection(url);
} catch (SQLException e) {
e.printStackTrace();
}
}
return cc;
}

OK 搞定了。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Phoenix的安裝使用與SQL查詢HBase HBase查詢引擎—Phoenix Phoenix查詢hbase HBase(三)之HBase+Phoenix實現分頁 CDH5..4.7+phoenix實現查詢HBase異常：java.sql.SQLException: ERROR 1102 (XCL02): Cannot get all table regions Hbase+Phoenix+Mybatis+Springboot整合查詢數據使用Phoenix通過sql語句更新操作hbase數據 Phoneix（四）hbase導入數據同時與phoenix實現映射同步 Hbase與phoenix關聯 [saiku] 使用 Apache Phoenix and HBase 結合 saiku 做大數據查詢分析