原文:阿里云上万个 Kubernetes 集群大规模管理实践

作者 汤志敏,阿里云容器服务高级技术专家 在 年 双 中,容器服务 ACK 支撑了阿里巴巴内部核心系统容器化和阿里云的云产品本身,也将阿里巴巴多年的大规模容器技术以产品化的能力输出给众多围绕 双 的生态公司。通过支撑来自全球各行各业的容器云,容器服务沉淀了支持单元化全球化架构和柔性架构的云原生应用托管中台能力,管理了超过 W 个以上的容器集群。本文将会介绍容器服务在海量 Kubernetes 集群 ...

2019-12-04 10:02 0 264 推荐指数:

查看详情

Rancher 和知乎超大规模集群管理联合实践

源起 知乎是中文互联网高质量的问答社区,每天有上千万用户在知乎分享知识、经验和见解,找到自己的答案。为配合不同阶段的业务发展需求,知乎容器平台也在不断演进、提升,目前几乎所有的业务都运行在容器上。 这两年知乎开始使用 Rancher 管理 Kubernetes 集群集群规模逐步达到近节点 ...

Thu Mar 17 20:06:00 CST 2022 0 652
大规模Elasticsearch集群管理心得

转载:http://elasticsearch.cn/article/110 ElasticSearch目前在互联网公司主要用于两种应用场景,其一是用于构建业务的搜索功能模块且多是垂直领域的搜索,数据量级一般在千万至数十亿这个级别;其二用于大规模数据的实时OLAP,经典的如ELKStack,数据 ...

Wed Mar 01 05:34:00 CST 2017 0 2418
基于阿里 Terway 网络的 Kubernetes 集群实践

作者:BGbiao ,来源:简书,原文链接 背景:众所周知的是在构建一个Kubernetes集群时,容器网络通常会使用一个独立的私有子网来构建Kubernetes集群内部的pod网络和service网络,但在实际的业务场景中,没有企业会在一段时间内将内部全部的服务都迁移到Kubernetes集群 ...

Thu Dec 19 21:33:00 CST 2019 0 1403
腾讯会议大规模使用Kubernetes的技术实践

腾讯会议,一款提供灵活协作的线上会议解决方案。其中大量的模块是有状态服务,在使用Kubernetes为其进行容器化部署时,Pod升级需保持共享内存、长连接服务。升级时只容忍ms级抖动,需提供大规模分批灰度发布、业务配额控制等能力,并同时解决集群节点负载不均衡、上万Pods的Workload的HPA ...

Thu Sep 17 17:50:00 CST 2020 0 643
大规模 Kubernetes 集群上实现高 SLO 的方法

作者 | 蚂蚁金服技术专家 姚菁华;蚂蚁金服高级开发工程师 范康 导读:随着 Kubernetes 集群规模和复杂性的增加,集群越来越难以保证高效率、低延迟的交付 pod。本文将分享蚂蚁金服在设计 SLO 架构和实现高 SLO 的方法和经验。 Why SLO ...

Fri Nov 06 22:20:00 CST 2020 0 435
大规模集群管理工具Borg

Google的大规模集群管理工具Borg 概述   Google的Borg系统是一个集群管理工具,在它上面运行着成千上万的job,这些job来自许许多多不同的应用,并且跨越多个集群,而每个集群又由大量的机器构成。   Borg通过组合准入控制,高效的任务打包,超额负载以及基于进程 ...

Mon Apr 11 19:25:00 CST 2016 0 2714
OpenPAI:大规模人工智能集群管理平台

微软亚洲研究院 2018年5月22日,在微软举办的“新一代人工智能开放科研教育平台暨中国高校人工智能科研教育高峰论坛”上,微软亚洲研究院宣布,携手北京大学、中国科学技术大学、西安交通大学和浙江大学四 ...

Sun May 27 04:53:00 CST 2018 0 842
 
粤ICP备18138465号  © 2018-2026 CODEPRJ.COM