Elasticsearch如何修改Mapping結構並實現業務零停機

本文轉載自查看原文 2020-01-26 14:34 1502

Elasticsearch 版本：6.4.0

一、疑問

在項目中后期，如果想調整索引的 Mapping 結構，比如將 ik_smart 修改為 ik_max_word 或者 增加分片數量 等，但 Elasticsearch 不允許這樣修改呀，怎么辦？

常規解決方法：

根據最新的 Mapping 結構再創建一個索引
將舊索引的數據全量導入到新索引中
告知用戶，業務要暫停使用一段時間
修改程序，將索引名替換成新的索引名稱，打包，重新上線
告知用戶，服務可以繼續使用了，並說一聲抱歉

我認為最大的弊端就是：需要修改替換程序，甚至有時候還得告知用戶暫停使用業務。

有沒有更好的方式去解決上面的需求呢？有！幸好，Elasticsearch 為我們提供了另外一種解決方法，可以不需要告知用戶和修改程序代碼。那就是通過索引別名來重建索引。

二、索引別名

索引別名可以關聯一個或多個索引，並且可以在任何需要索引名稱的 API 中使用。通俗解釋，別名類似於 windows 的快捷方式，linux 的軟鏈接，mysql 的視圖。別名為我們提供了極大的靈活性。它們允許我們執行以下操作：

在正在運行的集群上，允許一個索引與另外一個索引之間透明切換。
對多個索引進行分組組合。比如，有根據月份來創建的索引，別名可與近三個月的索引進行關聯。這樣的話，我們就可以通過別名來 查詢近三個月索引 的全部數據。如果別名用得好，可以更好地控制檢索數據量的大小，來提高查詢效率，但這也需要經驗的積累。

本文開頭遇到的問題，就可以通過索引別名來實現，現在我們學習一下具體操作。

三、具體操作

如何在零停機（該索引所用到的程序不停止運行）的前提下，修改索引的 Mapping 字段類型呢？可大體分為三步：

1、步驟一：復制數據

使用 reindex 操作來將舊索引（dynamic_data_v2）的數據完全復制到新索引（dynamic_data_v5）上：

POST _reindex
{
    "source": {
        "index": "dynamic_data_v2"
    },
    "dest": {
        "index": "dynamic_data_v5"
    }
}

執行結果：

2、步驟二：修改別名關聯

POST /_aliases
{
    "actions": [
        { "remove": { "index": "dynamic_data_v2", "alias": "dynamic_data" }},
        { "add":    { "index": "dynamic_data_v5", "alias": "dynamic_data" }}
    ]
}

3、步驟三：刪除舊索引（可選）

DELETE dynamic_data_v2

4、小結

至此，我們達到了偽更新（對於用戶來說透明化，無需停止服務）的效果。不過這里存在一個問題，如果數據量超大的話，復制數據所消費的時間比較多，所以構建索引前還是要盡量考慮周全 mapping 結構。

四、可修改 mapping 的個別情況

Elasticsearch 不允許修改/刪除 Mapping 已存在字段是因為：其底層使用的是 lucene 庫，索引和搜索要涉及分詞方式等操作，更改 Mapping 將意味着使已建立索引的文檔失效，所以不允許修改已存在字段類型等設置。

但也有個別情況：Elasticsearch 允許我們將字段添加到索引現有的 Mapping 結構中或更改現有字段的僅搜索設置。

1、可以新增字段

POST dynamic_data_v2/_mapping/_doc
{
  "properties": {
     "amount":{
        "type":"text"
     }
  }
}

2、可以更改字段類型為 multi_field

PUT dynamic_data_v2/_mapping/_doc
{
  "properties": {
     "amount":{
        "type":"text",
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 10
          }
        }
     }
  }
}
# 為 amount 增加 multi_field
# "fields": {
#    "keyword": {
#       "type": "keyword",
#       "ignore_above": 10
#    }
# }

3、可以將新 properties 添加到 “對象” 數據類型字段。

在 Mapping 的 field 里面設置 properties ，可以使字段存儲 Object 的數據類型。以下的 name 可以理解為 “對象”數據類型字段：

# 新增 name 字段，附帶first的properties屬性
PUT dynamic_data_v2/_mapping/_doc
{
  "properties": {
     "name":{
        "properties": {
            "first": {
              "type": "text"
            }
        }
     }
  }
}
# 可以支持繼續新增一個名為last的properties屬性
PUT dynamic_data_v2/_mapping/_doc
{
  "properties": {
     "name":{
        "properties": {
            "last": {
              "type": "text"
            }
        }
     }
  }
}

如下圖所示：

存儲數據：

# name 的對象里面有兩個字段，分別為：first 和 last，代表名和姓，比如“范閑”。
PUT dynamic_data_v2/_doc/1
{
  "name": {
    "first": "閑",
    "last": "范"
  }
}

查詢數據：

GET dynamic_data_v2/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match_phrase": {
            "name.last": "范"
          }
        },
        {
          "match_phrase": {
            "name.first": "閑"
          }
        }
      ]
    }
  }
}

返回結果：

上述三種方式，詳情可參考：

https://www.elastic.co/guide/en/elasticsearch/reference/6.4/indices-put-mapping.html#updating-field-mappings

五、總結

別名是個好東西，而索引別名只是別名的其中一個類型。一般在項目中后期，索引中有大量數據的時候，才能體會到索引別名的妙用。正如本文提及：

用戶無感知地維護數據修改更新。
索引組合查詢，如果使用得當，可以實現精准快速查詢，提高效率。

建議： 相同索引別名的物理索引有 一致的 Mapping 和數據結構 ，以提升檢索效率。

點關注，不迷路

好了各位，以上就是這篇文章的全部內容了，能看到這里的人呀，都是人才。

白嫖不好，創作不易。各位的支持和認可，就是我創作的最大動力，我們下篇文章見！

如果本篇博客有任何錯誤，請批評指教，不勝感激！

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 elasticsearch 修改 mapping Elasticsearch索引mapping的寫入、查看與修改(轉) elasticsearch 之mapping Elasticsearch Mapping ElasticSearch(5)-Mapping 【ElasticSearch（十一）進階】Mapping的查詢、創建、修改、刪除 elasticsearch 索引，更新，增量更新，不停機修改升級 ,簡單使用 Elasticsearch 創建以及修改索引結構不停機遷移 elasticsearch 集群不停機不停服務，MYSQL可以這樣修改億級數據表結構