Elasticsearch Reindex性能提升10倍+實戰

本文轉載自查看原文 2020-05-13 13:53 1407 ELK Stack

文章轉載自：
https://mp.weixin.qq.com/s?__biz=MzI2NDY1MTA3OQ==&mid=2247484134&idx=1&sn=750249a97c42b2ba22ba6755c79acb10&chksm=eaa82acedddfa3d822a4d3bbfb6dc76f57152705d1cba9fd2d8f4196013c950d9adea079a55f&scene=21#wechat_redirect

1、reindex速率極慢，是否有辦法改善？

以下問題來自社區：http://t.cn/RDOcX0O

問題1：reindex和snapshot的速率極慢，是否有辦法改善？

reindex和snapshot的速率比用filebeat或者kafka到es的寫入速率慢好幾個數量級（集群寫入性能不存在瓶頸），reindex/snapshot的時候CPU還是IO使用率都很低，是不是集群受什么參數限制了reindex和snapshot的速率？

reindex不管是跨集群還是同集群上都很慢，大約3~5M/s的索引速率，會是什么原因導致的？
問題2：數據量幾十個G的場景下，elasticsearch reindex速度太慢，從舊索引導數據到新索引，當前最佳方案是什么？
2、Reindex簡介

5.X版本后新增Reindex。

Reindex可以直接在Elasticsearch集群里面對數據進行重建，如果你的mapping因為修改而需要重建，又或者索引設置修改需要重建的時候，借助Reindex可以很方便的異步進行重建，並且支持跨集群間的數據遷移。比如按天創建的索引可以定期重建合並到以月為單位的索引里面去。

當然索引里面要啟用_source。

1POST _reindex
2{
3 "source": {
4 "index": "twitter"
5 },
6 "dest": {
7 "index": "new_twitter"
8 }
9}

3、原因分析

reindex的核心做跨索引、跨集群的數據遷移。

慢的原因及優化思路無非包括：

1）批量大小值可能太小。
需要結合堆內存、線程池調整大小；

2）reindex的底層是scroll實現，借助scroll並行優化方式，提升效率；

3）跨索引、跨集群的核心是寫入數據，考慮寫入優化角度提升效率。

4、Reindex提升效率的方案
4.1 提升批量寫入大小值

默認情況下，_reindex使用1000進行批量操作，您可以在source中調整batch_size。

1POST _reindex
2{
3 "source": {
4 "index": "source",
5 "size": 5000
6 },
7 "dest": {
8 "index": "dest",
9 "routing": "=cat"
10 }
11}

批量大小設置的依據：

（1）使用批量索引請求以獲得最佳性能。
批量大小取決於數據、分析和集群配置，但一個好的起點是每批處理5-15 MB。

注意，這是物理大小。文檔數量不是度量批量大小的好指標。例如，如果每批索引1000個文檔，:

1）每個1kb的1000個文檔是1mb。

2）每個100kb的1000個文檔是100 MB。

這些是完全不同的體積大小。

（2）逐步遞增文檔容量大小的方式調優。
1）從大約5-15 MB的大容量開始，慢慢增加，直到你看不到性能的提升。然后開始增加批量寫入的並發性(多線程等等)。

2）使用kibana、cerebro或iostat、top和ps等工具監視節點，以查看資源何時開始出現瓶頸。如果您開始接收EsRejectedExecutionException，您的集群就不能再跟上了:至少有一個資源達到了容量。要么減少並發性，或者提供更多有限的資源(例如從機械硬盤切換到ssd固態硬盤)，要么添加更多節點。

4.2 借助scroll的sliced提升寫入效率

Reindex支持Sliced Scroll以並行化重建索引過程。這種並行化可以提高效率，並提供一種方便的方法將請求分解為更小的部分。
sliced原理（from medcl）

1）用過Scroll接口吧，很慢？如果你數據量很大，用Scroll遍歷數據那確實是接受不了，現在Scroll接口可以並發來進行數據遍歷了。

2）每個Scroll請求，可以分成多個Slice請求，可以理解為切片，各Slice獨立並行，利用Scroll重建或者遍歷要快很多倍。
slicing使用舉例

slicing的設定分為兩種方式：手動設置分片、自動設置分片。

手動設置分片參見官網。

自動設置分片如下：

1POST _reindex?slices=5&refresh
2{
3 "source": {
4 "index": "twitter"
5 },
6 "dest": {
7 "index": "new_twitter"
8 }
9}

slices大小設置注意事項：
1）slices大小的設置可以手動指定，或者設置slices設置為auto，auto的含義是：針對單索引，slices大小=分片數；針對多索引，slices=分片的最小值。

2）當slices的數量等於索引中的分片數量時，查詢性能最高效。slices大小大於分片數，非但不會提升效率，反而會增加開銷。

3）如果這個slices數字很大(例如500)，建議選擇一個較低的數字，因為過大的slices 會影響性能。
4.3 ES副本數設置為0

如果要進行大量批量導入，請考慮通過設置index.number_of_replicas來禁用副本：0。

主要原因在於：

復制文檔時，將整個文檔發送到副本節點，並逐字重復索引過程。 這意味着每個副本都將執行分析，索引和潛在合並過程。

相反，如果您使用零副本進行索引，然后在提取完成時啟用副本，則恢復過程本質上是逐字節的網絡傳輸。 這比復制索引過程更有效。

1PUT /my_logs/_settings
2{
3 "number_of_replicas": 1
4}

4.4 增加refresh間隔

如果你的搜索結果不需要接近實時的准確性，考慮先不要急於索引刷新refresh。可以將每個索引的refresh_interval到30s。

如果正在進行大量數據導入，可以通過在導入期間將此值設置為-1來禁用刷新。完成后不要忘記重新啟用它!

設置方法：

1PUT /my_logs/_settings
2{ "refresh_interval": -1 }

5、小結

實踐證明，比默認設置reindex速度能提升10倍+。

遇到類似問題，多從官網、原理甚至源碼的角度思考，逐步拆解分析。

只要思維不滑坡，辦法總比問題多！

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 干貨 | Elasticsearch Reindex性能提升10倍+實戰（轉）讓程序的性能提升10倍如何把Go調用C的性能提升10倍？ Nacos 2.0 正式發布，性能提升 10 倍！！ Nacos 2.0 正式發布，性能提升了 10 倍！！ Databricks緩存提升Spark性能--為什么NVMe固態硬盤能夠提升10倍緩存性能（原創翻譯） Java 中的5個代碼性能提升技巧，最高提升近10倍 elasticsearch reIndex 重磅官宣：Nacos2.0 發布，性能提升 10 倍存算分離下寫性能提升10倍以上，EMR Spark引擎是如何做到的？