ELK 性能(2) — 如何在大業務量下保持 Elasticsearch 集群的穩定

介紹

如何在大業務量下保持 Elasticsearch 集群的穩定？

Server 1	Server 2	Server 3

C-D-(M)	C-D-M*	C-D-(M)

對於以上每個服務器 1、2、3：

CPU:	10 phyical cores @ 2.80GHz
RAM:	256GB or more ...
Disques:	SSD 300GB or more ...

C  = Client
D  = Data
M* = Elected Master
M  = Eligible as Master

峰值出現在下午 5 點，有 75% 的用戶同時在線，操作包括：

下午 5 點發生了什么？

為了解決這樣類似的問題，我們需要改變底層的架構以及請求方式。

Server 1	Server 2	Server 3

C-D-(M)	C-D-M* (不可用)	C-D-(M)

如果當前節點是主節點，當 JVM 在幾秒內無法響應時，會發生新的選舉。而相同的問題在新的主節點選舉完成后立即會發生，這會導致集群不穩定。

** 即使宕機的不是主節點，再平衡也需要花時間，同時也會給集群帶來壓力

分而治之

容量大的堆在進行垃圾回收時需要的時間更長，這個缺點也是導致集群不穩定的原因

虛擬化

主節點：
- 主節點管理並反映一個集群的真實狀態。
客戶端節點：（只為客戶端節點開放 HTTP）
- 客戶端節點將數據節點保護在防火牆之后，只有客戶端節點可以被外部訪問。
- 客戶端節點知道數據存儲的位置，並且可以查詢正確的片（shard）歸並結果並返回。
數據節點：
- 只有數據節點存儲數據，用它們來索引並搜索。

** 不要使用主節點作為客戶端，因為在大量聚合、排序以及需要大量計算的腳本執行時，會導致節點的狀態不穩定。

由場景決定。

在以上的場景中，我們會保持每個分片（shard）大小在 1 到 4GB ，這樣查詢速度會比較快，在重啟或者節點宕掉的時候分片重排也會比較快。

分片必須足夠小，讓硬件可以有能力處理。分片本身的大小並不受技術的限制，它受硬件的限制。
當分片增長到很大時，我么可以選擇為 Elasticsearch 重建整個索引並設置更多的分片，可以進行橫向擴展，或者根據（時間段，用戶）拆分索引。

注意，一旦需要處理很多分片，需要在數據分布與協調各個分片的代價中做權衡。

參考來源:

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 elasticsearch配置集群+elk報錯總結業務高速增長場景下的穩定性建設實戰如何在docker下安裝elasticsearch（上） centos7搭建ELK Cluster集群日志分析平台（一）：Elasticsearch Centos8 部署 ElasticSearch 集群並搭建 ELK，基於Logstash同步MySQL數據到ElasticSearch 萬級K8s集群背后etcd穩定性及性能優化實踐性能測試需求分析業務PV量，響應時間、QPS、TPS centos7部署elk集群(filebeat+kafka+logstash+elasticsearch+kibana) 騰訊雲Elasticsearch集群規划及性能優化實踐 ELK之elasticsearch刪除索引