原文:当 K8s 集群达到万级规模,阿里巴巴如何解决系统各组件性能问题?

作者 阿里云容器平台高级技术专家 曾凡松 逐灵 本文主要介绍阿里巴巴在大规模生产环境中落地 Kubernetes 的过程中,在集群规模上遇到的典型问题以及对应的解决方案,内容包含对 etcd kube apiserver kube controller 的若干性能及稳定性增强,这些关键的增强是阿里巴巴内部上万节点的 Kubernetes 集群能够平稳支撑 年天猫 大促的关键所在。 背景 从阿里巴巴 ...

2019-09-23 10:11 2 1273 推荐指数:

查看详情

超大规模商用 K8s 场景下,阿里巴巴如何动态解决容器资源的按需分配问题

作者 | 张晓宇(衷源) 阿里云容器平台技术专家 关注『阿里巴巴云原生』公众号,回复关键词“1010****”,可获取本文 PPT。 导读:资源利用率一直是很多平台管理和研发人员关心的话题。本文作者通过阿里巴巴容器平台团队在这一领域的工作实践,整理出了一套资源利用提升的方案,希望能 ...

Sat Oct 12 17:47:00 CST 2019 1 494
备战双 11!蚂蚁金服规模 K8s 集群管理系统如何设计?

作者 | 蚂蚁金服技术专家 沧漠 关注『阿里巴巴云原生』公众号,回复关键词“1024****”,可获取本文 PPT。 前言 Kubernetes 以其超前的设计理念和优秀的技术架构,在容器编排领域拔得头筹。越来越多的公司开始在生产环境部署实践 Kubernetes,在阿里巴巴和蚂蚁金服 ...

Mon Oct 28 18:07:00 CST 2019 1 1535
K8s 实践 | 如何解决多租户集群的安全隔离问题

作者 | 匡大虎 阿里巴巴技术专家 导读:如何解决多租户集群的安全隔离问题是企业上云的一个关键问题,本文主要介绍 Kubernetes 多租户集群的基本概念和常见应用形态,以及在企业内部共享集群的业务场景下,基于 Kubernetes 原生和 ACK 集群现有安全管理能力快速实现多租户 ...

Sat Jan 11 05:38:00 CST 2020 0 1112
k8s集群关机后,如何解决 kubernetes 重启起不来的问题

何解决 kubernetes 重启后,启来不来的问题 登录自己的Kubernetes测试集群时发现集群好像没有启动成功 运行 kubectl get pods --all -A ,报错如下。 第一反应Kubernetes API server没有启动。 因为我的Kubernetes ...

Sat Mar 05 20:00:00 CST 2022 0 2071
阿里云Ubuntu系统部署K8s集群

首先说一下我的环境和配置:阿里云1核2G,系统是Ubuntu18.04(最好是2核,因为master有限制,不是的话也没关系,因为到时候可以忽略掉),node也是1核2G 好了开始进入正题吧 1,更新系统源 如果系统本身自带得镜像地址,服务器在国外,下载速度会很慢,可以打开 /etc/apt ...

Thu Oct 14 22:44:00 CST 2021 0 177
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM