原文:面對大規模 K8s 集群,如何先於用戶發現問題?

作者 彭南光 光南 來源 阿里巴巴雲原生公眾號 千里之堤,潰於蟻穴。 緒論 不知道大家是否經歷過這樣的情景:突然被用戶告知系統出現問題,然后一臉懵地惶惶然排查修復 或是等到自己發現系統出現故障時,實際已經對用戶造成了嚴重的惡劣影響。 所謂千里之堤,潰於蟻穴。用戶信任的建立是長期而艱難的,然而要摧毀這種信任卻很簡單。一旦出現上述問題,不僅極大影響用戶使用體驗,同時會給用戶留下一個這個產品 團隊不可 ...

2021-04-25 16:38 0 233 推薦指數:

查看詳情

K8S 大規模場景下, Service 性能如何優化?

摘要:Kubernetes 原生的 Service 負載均衡基於 Iptables 實現,其規則鏈會隨 Service 的數量呈線性增長,在大規模場景下對 Service 性能影響嚴重。本文分享了華為雲在 Kubernetes service 性能優化方面的探索與實踐。 在企業業務推進 ...

Tue Jun 30 01:19:00 CST 2020 0 929
K8s 集群達到萬級規模,阿里巴巴如何解決系統各組件性能問題

作者 | 阿里雲容器平台高級技術專家 曾凡松(逐靈) 本文主要介紹阿里巴巴在大規模生產環境中落地 Kubernetes 的過程中,在集群規模上遇到的典型問題以及對應的解決方案,內容包含對 etcd、kube-apiserver、kube-controller 的若干性能及穩定性增強,這些關鍵 ...

Mon Sep 23 18:11:00 CST 2019 2 1273
k8s 集群部署問題整理

1、hostname “master” could not be reached在host中沒有加解析 2、curl -sSL http://localhost:10248/healthzcurl: ...

Thu Jan 16 17:28:00 CST 2020 0 1637
k8s 集群部署問題整理

1、hostname “master” could not be reached在host中沒有加解析 2、curl -sSL http://localhost:10248/healthzcurl: ...

Mon Mar 18 03:08:00 CST 2019 0 9112
k8s集群問題記錄

k8s集群問題記錄 k8s學習方案 問題解決思路 主要學習路徑: rancher(k8s)->rke->helm->kubectl->k8sk8s中文api) 常見問題總結: 怎么解決簡單就怎么解決 ...

Thu Feb 13 07:27:00 CST 2020 0 701
k8s服務發現

K8S服務發現 服務發現就是服務(應用)之間相互定位的過程。 服務發現不是非雲計算時代獨有的,傳統的單體架構時代也會用到。以下應用場景下,更需要服務發現。 服務(應用)的動態性強 服務(應用)更新發布頻繁 服務(應用)支持自動伸縮 在K8S ...

Sun Aug 23 06:35:00 CST 2020 0 846
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM