ElasticStack學習（八）：ElasticSearch索引模板與聚合分析初探

本文轉載自查看原文 2019-07-17 09:00 486 ElasticSearch

一、Index Template與Dynamic Template的概念

　　1、Index Template：它是用來根據提前設定的Mappings和Settings，並按照一定的規則，自動匹配到新創建的索引上。

　　　　1）模板僅是一個索引被創建時才會起作用，修改模板並不會影響已創建的索引；

　　　　2）可以設定多個索引模板，這些設置會被merge在一起；

　　　　3）通過指定order的數值，控制merge的過程；

　　2、Index Template的工作方式如下：

　　　　當一個索引被創建時，會執行如下操作：

　　　　1）應用ElasticSearch默認的Mappings和Settings；

　　　　2）應用order數值低的Index Template中的設定；

　　　　3）應用order數值高的Index Template中的設定，之前的設定會被覆蓋；

　　　　4）創建索引時，用戶此時進一步指定了索引的Mappings和Settings，那么覆蓋之前模板中的設定；

　　3、Dynamic Template：根據ElasticSearch識別的數據類型，結合字段名稱，動態設定字段類型。

　　　　1）例如：所有的字符串類型可以設定成keyword，或者關閉keyword字段；

　　　　2）例如：凡是Is開頭的字段都設置成Boolean；

　　　　3）例如：凡是Long開頭的都設置成Long；

　　　　如下圖所示：

　　　　Dynamic Template是定義在索引的Mappings中的，有一個模板名稱，匹配規則是一個數組，同時可以將符合規則的字段進行Mapping。

二、Index Template與Dynamic Template使用

　　1、Index Template

　　　　1）通過創建一個dynamic mapping的索引，會發現日期類型推斷成功，而數值類型被推斷成text類型。

　　　　2）創建一個可以識別以test字符開頭的索引模板，同時將日期識別設置為false，將數值識別設置為true。會發現日期會推斷為text類型，數值類型推斷正常。

　　　　3）在創建索引時，設置settings的值，會覆蓋模板設置信息。

　　2、Dynamic Template

　　　創建的索引進行mappings設置

　　通過對mapping信息的讀取可以發現，is開頭的字段是boolean類型，duty字段是keyword類型，匹配name開頭的字段，將信息可以copy_to到fullname字段中，不匹配middle后綴的字段信息。

　　當對fullname字段搜索關於middle字段的信息時，搜索不到結果，當搜索first或者lastname時，可以搜索到結果。

三、聚合的說明（Aggregation）

　　1、ElasticSearch聚合的優勢

　　　　1）ElasticSearch除了搜索外，還提供了針對ElasticSearch數據進行統計分析的功能；

　　　　相對於Hadoop而言，ElasticSearch在這方面實時性高，比Hadoop的T+1更及時。

　　　　2）通過聚合，會得到一個數據的概覽，這樣就可以分析和總結全套的數據，而不是僅僅能尋找單個文檔；

　　　　3）易用性，只需要一條語句，就可以從ElasticSearch中得到分析結果，從而避免在客戶端實現分析邏輯；

　　2、聚合的分類

　　　　1）Bucket Aggregation：一些列滿足特定條件的文檔集合，其相當於SQL中的Group By；

　　　　2）Metric Aggregation：一些數學運算，可以對文檔字段進行統計分析；

　　　　　　其相當於SQL中對於字段進行運算的函數，如Sum、Count等。它除了可以在字段上進行計算，還可以在腳本產生的結果上進行計算。

　　　　　　大多數Metric是數學計算，輸出一個值，如：min/max/sum/avg/cardinality。

　　　　　　部分支持輸出多個值，如：stats/percentiles/percentile_ranks。

　　　　3）Pipeline Aggregation：對其他的聚合結果進行二次聚合；

　　　　4）Matrix Aggregation：支持對多個字段的操作並提供一個結果矩陣；

　　3、聚合的使用

　　　　1）Bucket Aggregation

　　　　2）Metric Aggregation

　　　　注意：在做聚合分析時，應將aggs前面的size設置為0，否則會返回查詢結果，而不是聚合結果。如果寫成20，聚合結果也能統計出來，只是在查詢結果的后面。

　　　　大家可關注我的公眾號

　　　　知識學習來源：阮一鳴：《Elasticsearch核心技術與實戰》

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 ElasticStack學習（七）：ElasticSearch之Mapping初探 ElasticStack學習（五）：了解ElasticSearch索引與分詞 ElasticStack學習（三）：ElasticSearch基本概念 Elasticsearch學習之嵌套聚合，下鑽分析，聚合分析 ElasticStack學習（一）：ElasticStack介紹 Elasticsearch學習之深入聚合分析四---案例實戰 ElasticStack學習（四）：ElasticSearch文檔的CRUD使用 Elasticsearch學習筆記（三）聚合分析Agg Elasticsearch聚合初探——metric篇 Elasticsearch索引聚合Aggregation