原文:阿里雲上萬個 Kubernetes 集群大規模管理實踐

作者 湯志敏,阿里雲容器服務高級技術專家 在 年 雙 中,容器服務 ACK 支撐了阿里巴巴內部核心系統容器化和阿里雲的雲產品本身,也將阿里巴巴多年的大規模容器技術以產品化的能力輸出給眾多圍繞 雙 的生態公司。通過支撐來自全球各行各業的容器雲,容器服務沉淀了支持單元化全球化架構和柔性架構的雲原生應用托管中台能力,管理了超過 W 個以上的容器集群。本文將會介紹容器服務在海量 Kubernetes 集群 ...

2019-12-04 10:02 0 264 推薦指數:

查看詳情

Rancher 和知乎超大規模集群管理聯合實踐

源起 知乎是中文互聯網高質量的問答社區,每天有上千萬用戶在知乎分享知識、經驗和見解,找到自己的答案。為配合不同階段的業務發展需求,知乎容器平台也在不斷演進、提升,目前幾乎所有的業務都運行在容器上。 這兩年知乎開始使用 Rancher 管理 Kubernetes 集群集群規模逐步達到近節點 ...

Thu Mar 17 20:06:00 CST 2022 0 652
大規模Elasticsearch集群管理心得

轉載:http://elasticsearch.cn/article/110 ElasticSearch目前在互聯網公司主要用於兩種應用場景,其一是用於構建業務的搜索功能模塊且多是垂直領域的搜索,數據量級一般在千萬至數十億這個級別;其二用於大規模數據的實時OLAP,經典的如ELKStack,數據 ...

Wed Mar 01 05:34:00 CST 2017 0 2418
基於阿里 Terway 網絡的 Kubernetes 集群實踐

作者:BGbiao ,來源:簡書,原文鏈接 背景:眾所周知的是在構建一個Kubernetes集群時,容器網絡通常會使用一個獨立的私有子網來構建Kubernetes集群內部的pod網絡和service網絡,但在實際的業務場景中,沒有企業會在一段時間內將內部全部的服務都遷移到Kubernetes集群 ...

Thu Dec 19 21:33:00 CST 2019 0 1403
騰訊會議大規模使用Kubernetes的技術實踐

騰訊會議,一款提供靈活協作的線上會議解決方案。其中大量的模塊是有狀態服務,在使用Kubernetes為其進行容器化部署時,Pod升級需保持共享內存、長連接服務。升級時只容忍ms級抖動,需提供大規模分批灰度發布、業務配額控制等能力,並同時解決集群節點負載不均衡、上萬Pods的Workload的HPA ...

Thu Sep 17 17:50:00 CST 2020 0 643
大規模 Kubernetes 集群上實現高 SLO 的方法

作者 | 螞蟻金服技術專家 姚菁華;螞蟻金服高級開發工程師 范康 導讀:隨着 Kubernetes 集群規模和復雜性的增加,集群越來越難以保證高效率、低延遲的交付 pod。本文將分享螞蟻金服在設計 SLO 架構和實現高 SLO 的方法和經驗。 Why SLO ...

Fri Nov 06 22:20:00 CST 2020 0 435
大規模集群管理工具Borg

Google的大規模集群管理工具Borg 概述   Google的Borg系統是一個集群管理工具,在它上面運行着成千上萬的job,這些job來自許許多多不同的應用,並且跨越多個集群,而每個集群又由大量的機器構成。   Borg通過組合准入控制,高效的任務打包,超額負載以及基於進程 ...

Mon Apr 11 19:25:00 CST 2016 0 2714
OpenPAI:大規模人工智能集群管理平台

微軟亞洲研究院 2018年5月22日,在微軟舉辦的“新一代人工智能開放科研教育平台暨中國高校人工智能科研教育高峰論壇”上,微軟亞洲研究院宣布,攜手北京大學、中國科學技術大學、西安交通大學和浙江大學四 ...

Sun May 27 04:53:00 CST 2018 0 842
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM