ElasticStack學習（七）：ElasticSearch之Mapping初探

本文轉載自查看原文 2019-07-16 12:41 1143 ElasticSearch/ ELK/ Elastic Stack

一、Mapping的概念

　　1、Mapping類似於數據庫中的Schema的定義，作用如下：

　　　　1）定義索引中的字段的名稱；

　　　　2）定義字段的數據類型，例如字符串、數字、日期、布爾等；

　　　　3）對每個字段進行倒排索引的建立及相關配置；

　　　　4）Mapping會將Json文檔映射成Lucene所需要的扁平格式；

　　　　5）一個Mapping屬於一個索引的Type，從7.0開始，不需要在Mapping中指定Type信息；

　　2、字段的數據類型

　　　　1）簡單類型

　　　　　　Text（會增加Keyword子字段）；

　　　　　　Date；

　　　　　 Integer/Long/Floating；

　　　　　　Boolean；

　　　　　　IP4&IP6；

　　　　　　Keyword；

　　　　2）復雜類型

　　　　　　對象類型；

　　　　　　嵌套類型；

　　　　　　數組（由第一個非空數值的類型所決定）；

　　　　　　空值；

　　　　3）特殊類型（地理信息）

　　　　　　geo_point&geo_shape

二、Dynamic Mapping的概念

　　1、在寫入文檔的時候，如果索引不存在，則會自動創建索引；

　　2、由於上述機制，可以無需手動定義Mapping，ElasticSearch會自動根據文檔信息，推算出字段的類型；

　　3、但是有時候推算的可能不對，當類型設置的不對時，會導致一些功能無法正常運行，比如范圍內的Range查詢；

三、Mapping與Dynamic Mapping的使用

　　1、推斷字段的類型

//創建一個文檔
put mapping_test/_doc/1
{
    "id":"100",
    "isvip":false,
    "isadmin":"true",
    "age":18,
    "height":180
}
//查看索引Mapping結構
get mapping_test/_mapping
//刪除索引
delete mapping_test

　　由上圖中可以得出，ElasticSearch基本上可以按照數據推斷出預想的字段類型，由於isadmin字段的值是由雙引號所括起來的，所以該字段被推斷成text類型。

　　2、更改Mapping的字段類型

　　對於索引后期加入的字段，可以按照如下情況進行設置：

　　　　1）新增加字段

　　　　　　a）Dynamic設置為True時，一旦有新增字段的文檔寫入，Mapping同時會被更新；

　　　　　　b）Dynamic設置為False時，有新增字段的文檔寫入，Mapping不會被更新，新增字段的數據也無法被索引，但是信息會出現在_Source中；

　　　　　　c）Dynamic設置成Strict時，文檔寫入失敗；

　　　　2）已有字段

　　　　　　a）對於已有字段，一旦已經有數據寫入，就不再支持修改字段定義。因為Lucene實現的倒排索引，一旦生成后，就不允許修改。

　　　　　　b）如果希望改變已有字段類型，必須ReIndex，重建索引；

　　　　　　為什么會這樣？

　　　　　　I）如果修改了字段的數據類型，會導致已被索引的屬於無法被搜索；

　　　　　　II）正因為如此，對於新增加的字段，就不會有這個問題的影響；

　　3、對於這幾種情況，我們通過下圖進行演示：

　　　　1）對於dynamic為true時，對於創建的文檔中的某一字段進行搜索，是可以查詢到的。

　　　　2）將dynamic設置為false，然后新增一個name字段，然后對其搜索，是無法搜索到的。

　　　　同時mapping中也不存在該字段。

　　　　但是可以在_Source中看到這個字段。

　　　　3）將dynamic設置為strict，然后新增一個grade字段，會發現出現異常。

四、索引Mapping的顯式定義

　　1、Mapping定義的方式有兩種：

　　　　1）可以參考API手冊，純手寫；

　　　　2）為了減少輸入工作量，減少出錯概率，可以依照以下步驟：

　　　　　　a）創建一個臨時的Index，寫入一些樣本數據；

　　　　　　b）通過訪問Mapping API獲取該臨時索引的動態Mapping定義；

　　　　　　c）修改成符合要求的Json，然后創建顯式索引；

　　　　　　d）將臨時索引刪除；

　　2、顯式Mapping定義的語法：

Put Index_Name
{
    "mappings":{
         定義Mapping信息，Json格式
　　　　　"properties":{
　　　　　　　　"column_name":{
　　　　　　　　　　"type":"text"
　　　　　　　　},
　　　　　　　　"column_name":{
　　　　　　　　　　"type":"long"
　　　　　　　　}
　　　　　　　　...
　　　　　　}
     } 
}