原文:面对大规模 K8s 集群,如何先于用户发现问题?

作者 彭南光 光南 来源 阿里巴巴云原生公众号 千里之堤,溃于蚁穴。 绪论 不知道大家是否经历过这样的情景:突然被用户告知系统出现问题,然后一脸懵地惶惶然排查修复 或是等到自己发现系统出现故障时,实际已经对用户造成了严重的恶劣影响。 所谓千里之堤,溃于蚁穴。用户信任的建立是长期而艰难的,然而要摧毁这种信任却很简单。一旦出现上述问题,不仅极大影响用户使用体验,同时会给用户留下一个这个产品 团队不可 ...

2021-04-25 16:38 0 233 推荐指数:

查看详情

K8S 大规模场景下, Service 性能如何优化?

摘要:Kubernetes 原生的 Service 负载均衡基于 Iptables 实现,其规则链会随 Service 的数量呈线性增长,在大规模场景下对 Service 性能影响严重。本文分享了华为云在 Kubernetes service 性能优化方面的探索与实践。 在企业业务推进 ...

Tue Jun 30 01:19:00 CST 2020 0 929
K8s 集群达到万级规模,阿里巴巴如何解决系统各组件性能问题

作者 | 阿里云容器平台高级技术专家 曾凡松(逐灵) 本文主要介绍阿里巴巴在大规模生产环境中落地 Kubernetes 的过程中,在集群规模上遇到的典型问题以及对应的解决方案,内容包含对 etcd、kube-apiserver、kube-controller 的若干性能及稳定性增强,这些关键 ...

Mon Sep 23 18:11:00 CST 2019 2 1273
k8s 集群部署问题整理

1、hostname “master” could not be reached在host中没有加解析 2、curl -sSL http://localhost:10248/healthzcurl: ...

Thu Jan 16 17:28:00 CST 2020 0 1637
k8s 集群部署问题整理

1、hostname “master” could not be reached在host中没有加解析 2、curl -sSL http://localhost:10248/healthzcurl: ...

Mon Mar 18 03:08:00 CST 2019 0 9112
k8s集群问题记录

k8s集群问题记录 k8s学习方案 问题解决思路 主要学习路径: rancher(k8s)->rke->helm->kubectl->k8sk8s中文api) 常见问题总结: 怎么解决简单就怎么解决 ...

Thu Feb 13 07:27:00 CST 2020 0 701
k8s服务发现

K8S服务发现 服务发现就是服务(应用)之间相互定位的过程。 服务发现不是非云计算时代独有的,传统的单体架构时代也会用到。以下应用场景下,更需要服务发现。 服务(应用)的动态性强 服务(应用)更新发布频繁 服务(应用)支持自动伸缩 在K8S ...

Sun Aug 23 06:35:00 CST 2020 0 846
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM