原文:當 K8s 集群達到萬級規模,阿里巴巴如何解決系統各組件性能問題?

作者 阿里雲容器平台高級技術專家 曾凡松 逐靈 本文主要介紹阿里巴巴在大規模生產環境中落地 Kubernetes 的過程中,在集群規模上遇到的典型問題以及對應的解決方案,內容包含對 etcd kube apiserver kube controller 的若干性能及穩定性增強,這些關鍵的增強是阿里巴巴內部上萬節點的 Kubernetes 集群能夠平穩支撐 年天貓 大促的關鍵所在。 背景 從阿里巴巴 ...

2019-09-23 10:11 2 1273 推薦指數:

查看詳情

超大規模商用 K8s 場景下,阿里巴巴如何動態解決容器資源的按需分配問題

作者 | 張曉宇(衷源) 阿里雲容器平台技術專家 關注『阿里巴巴雲原生』公眾號,回復關鍵詞“1010****”,可獲取本文 PPT。 導讀:資源利用率一直是很多平台管理和研發人員關心的話題。本文作者通過阿里巴巴容器平台團隊在這一領域的工作實踐,整理出了一套資源利用提升的方案,希望能 ...

Sat Oct 12 17:47:00 CST 2019 1 494
備戰雙 11!螞蟻金服規模 K8s 集群管理系統如何設計?

作者 | 螞蟻金服技術專家 滄漠 關注『阿里巴巴雲原生』公眾號,回復關鍵詞“1024****”,可獲取本文 PPT。 前言 Kubernetes 以其超前的設計理念和優秀的技術架構,在容器編排領域拔得頭籌。越來越多的公司開始在生產環境部署實踐 Kubernetes,在阿里巴巴和螞蟻金服 ...

Mon Oct 28 18:07:00 CST 2019 1 1535
K8s 實踐 | 如何解決多租戶集群的安全隔離問題

作者 | 匡大虎 阿里巴巴技術專家 導讀:如何解決多租戶集群的安全隔離問題是企業上雲的一個關鍵問題,本文主要介紹 Kubernetes 多租戶集群的基本概念和常見應用形態,以及在企業內部共享集群的業務場景下,基於 Kubernetes 原生和 ACK 集群現有安全管理能力快速實現多租戶 ...

Sat Jan 11 05:38:00 CST 2020 0 1112
k8s集群關機后,如何解決 kubernetes 重啟起不來的問題

何解決 kubernetes 重啟后,啟來不來的問題 登錄自己的Kubernetes測試集群時發現集群好像沒有啟動成功 運行 kubectl get pods --all -A ,報錯如下。 第一反應Kubernetes API server沒有啟動。 因為我的Kubernetes ...

Sat Mar 05 20:00:00 CST 2022 0 2071
阿里雲Ubuntu系統部署K8s集群

首先說一下我的環境和配置:阿里雲1核2G,系統是Ubuntu18.04(最好是2核,因為master有限制,不是的話也沒關系,因為到時候可以忽略掉),node也是1核2G 好了開始進入正題吧 1,更新系統源 如果系統本身自帶得鏡像地址,服務器在國外,下載速度會很慢,可以打開 /etc/apt ...

Thu Oct 14 22:44:00 CST 2021 0 177
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM