簡介
Elasticsearch SQL是一個X-Pack組件,它允許針對Elasticsearch實時執行類似SQL的查詢。無論使用REST接口,命令行還是JDBC,任何客戶端都可以使用SQL對Elasticsearch中的數據進行原生搜索和聚合數據。可以將Elasticsearch SQL看作是一種翻譯器,它可以將SQL翻譯成Query DSL。
Elasticsearch SQL具有如下特性:
- 原生支持:Elasticsearch SQL是專門為Elasticsearch打造的。
- 沒有額外的零件:無需其他硬件,處理器,運行環境或依賴庫即可查詢Elasticsearch,Elasticsearch SQL直接在Elasticsearch內部運行。
- 輕巧高效:Elasticsearch SQL並未抽象化其搜索功能,相反的它擁抱並接受了SQL來實現全文搜索,以簡潔的方式實時運行全文搜索。
學前准備
學習之前我們需要先對Elasticsearch有所了解,並安裝好Elasticsearch和Kibana,這里安裝的是7.6.2版本
安裝完成后在Kibana中導入測試數據,數據地址:https://github.com/macrozheng/mall-learning/blob/master/document/json/accounts.json
直接在Kibana的Dev Tools中運行如下命令即可:

第一個SQL查詢
我們使用SQL來查詢下前10條記錄,可以通過format
參數控制返回結果的格式,txt表示文本格式,看起來更直觀點,默認為json格式。
在Kibana的Console中輸入如下命令:
POST /_sql?format=txt { "query": "SELECT account_number,address,age,balance FROM account LIMIT 10" }
查詢結果顯示如下。

將SQL轉化為DSL
當我們需要使用Query DSL時,也可以先使用SQL來查詢,然后通過Translate API轉換即可。
例如我們翻譯以下查詢語句:
POST /_sql/translate { "query": "SELECT account_number,address,age,balance FROM account WHERE age>32 LIMIT 10" }
最終獲取到Query DSL結果如下。

SQL和DSL混合使用
我們還可以將SQL和Query DSL混合使用,比如使用Query DSL來設置過濾條件。
例如查詢age在30-35之間的記錄,可以使用如下查詢語句:
POST /_sql?format=txt { "query": "SELECT account_number,address,age,balance FROM account", "filter": { "range": { "age": { "gte" : 30, "lte" : 35 } } }, "fetch_size": 10 }
查詢結果展示如下:

SQL和ES對應關系

常用SQL操作
語法
在ES中使用SQL查詢的語法與在數據庫中使用基本一致,具體格式如下:
SELECT select_expr [, ...] [ FROM table_name ] [ WHERE condition ] [ GROUP BY grouping_element [, ...] ] [ HAVING condition] [ ORDER BY expression [ ASC | DESC ] [, ...] ] [ LIMIT [ count ] ] [ PIVOT ( aggregation_expr FOR column IN ( value [ [ AS ] alias ] [, ...] ) ) ]
WHERE
可以使用WHERE語句設置查詢條件,比如查詢state字段為VA的記錄,查詢語句如下。
POST /_sql?format=txt { "query": "SELECT account_number,address,age,balance,state FROM account WHERE state='VA' LIMIT 10 " }
查詢結果展示如下:

`GROUP BY
我們可以使用GROUP BY
語句對數據進行分組,統計出分組記錄數量,最大age和平均balance等信息,查詢語句如下。
POST /_sql?format=txt { "query": "SELECT state,COUNT(*),MAX(age),AVG(balance) FROM account GROUP BY state LIMIT 10" }
HAVING
我們可以使用HAVING
語句對分組數據進行二次篩選,比如篩選分組記錄數量大於15的信息,查詢語句如下。
POST /_sql?format=txt { "query": "SELECT state,COUNT(*),MAX(age),AVG(balance) FROM account GROUP BY state HAVING COUNT(*)>15 LIMIT 10" }
DESCRIBE
我們可以使用DESCRIBE語句查看表(ES中為索引)中有哪些字段,比如查看account表的字段,查詢語句如下。
POST /_sql?format=txt { "query": "DESCRIBE account" }
SHOW TABLES
我們可以使用SHOW TABLES
查看所有的表(ES中為索引)。
POST /_sql?format=txt { "query": "SHOW TABLES" }
支持的函數
使用SQL查詢ES中的數據,不僅可以使用一些SQL中的函數,還可以使用一些ES中特有的函數。
查詢支持的函數
我們可以使用SHOW FUNCTIONS
語句查看所有支持的函數,比如搜索所有帶有DATE
字段的函數可以使用如下語句。
POST /_sql?format=txt { "query": "SHOW FUNCTIONS LIKE '%DATE%'" }
全文搜索函數是ES中特有的,當使用MATCH
或QUERY
函數時,會啟用全文搜索功能,SCORE
函數可以用來統計搜索評分。
MATCH()
使用MATCH
函數查詢address
中包含Street
的記錄。
POST /_sql?format=txt { "query": "SELECT account_number,address,age,balance,SCORE() FROM account WHERE MATCH(address,'Street') LIMIT 10" }
QUERY()
使用QUERY
函數查詢address
中包含Street
的記錄。
POST /_sql?format=txt { "query": "SELECT account_number,address,age,balance,SCORE() FROM account WHERE QUERY('address:Street') LIMIT 10" }
SQL CLI
如果你不想使用Kibana來使用ES SQL的話,也可以使用ES自帶的SQL CLI來查詢,該命令位於ES的bin目錄下。
使用如下命令啟動SQL CLI:
elasticsearch-sql-cli http://localhost:9200
然后直接輸入SQL命令即可查詢了,注意要加分號。
SELECT account_number,address,age,balance FROM account LIMIT 10;
局限性
使用SQL查詢ES有一定的局限性,沒有原生的Query DSL那么強大,對於嵌套屬性和某些函數的支持並不怎么好,但是平時用來查詢下數據基本夠用了。
參考資料
官方文檔:https://www.elastic.co/guide/en/elasticsearch/reference/7.6/xpack-sql.html
鏈接:https://www.jianshu.com/p/cf091da8fa77
來源:簡書
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。