原文:在大規模 Kubernetes 集群上實現高 SLO 的方法

作者 螞蟻金服技術專家 姚菁華 螞蟻金服高級開發工程師 范康 導讀:隨着 Kubernetes 集群規模和復雜性的增加,集群越來越難以保證高效率 低延遲的交付 pod。本文將分享螞蟻金服在設計 SLO架構和實現高 SLO 的方法和經驗。 Why SLO Gartner 對 SLO 的定義:在 SLA 框架下,SLO 是系統必須要達到的目標 需要盡可能地保障調用方的成功。有些人可能會對 SLI S ...

2020-11-06 14:20 0 435 推薦指數:

查看詳情

阿里雲上萬個 Kubernetes 集群大規模管理實踐

作者 | 湯志敏,阿里雲容器服務高級技術專家 在 2019 年 雙11 中,容器服務 ACK 支撐了阿里巴巴內部核心系統容器化和阿里雲的雲產品本身,也將阿里巴巴多年的大規模容器技術以產品化的能力輸出給眾多圍繞 雙11 的生態公司。通過支撐來自全球各行各業的容器雲,容器服務沉淀了支持單元化 ...

Wed Dec 04 18:02:00 CST 2019 0 264
Docker Swarm和Kubernetes大規模集群中的性能比較

Contents 這篇文章主要針對Docker Swarm和Kubernetes大規模部署的條件下的3個問題展開討論。在大規模部署下,它們的性能如何?它們是否可以被批量操作?需要采取何種措施來支持他們的大規模部署和運維? 我們需要使用側重於用例的基准測試來對所有容器平台進行 ...

Sun Feb 02 19:25:00 CST 2020 0 336
大規模Elasticsearch集群管理心得

轉載:http://elasticsearch.cn/article/110 ElasticSearch目前在互聯網公司主要用於兩種應用場景,其一是用於構建業務的搜索功能模塊且多是垂直領域的搜索,數據量級一般在千萬至數十億這個級別;其二用於大規模數據的實時OLAP,經典的如ELKStack,數據 ...

Wed Mar 01 05:34:00 CST 2017 0 2418
實例演示:如何在Kubernetes大規模運行CI/CD

本周四晚上8:30,第二期k3s在線培訓如約開播!本期課程將介紹k3s的核心架構,如可用架構以及containerd。一起來進階探索k3s吧! 報名及觀看鏈接:http://z-mz.cn/PmwZ 本文來自Rancher Labs 在雲原生領域中,Kubernetes累積 ...

Tue Feb 18 19:20:00 CST 2020 0 762
大規模微服務單元化與可用設計

說到大規模微服務系統,往往是一些7*24時不間斷運行的在線系統,這樣的系統往往有以下的要求: 第一,可用。這類的系統往往需要保持一定的SLA的,7*24時不間斷運行不代表完全不掛,而是有一定的百分比的。例如我們常說的可用性需達到4個9(99.99%),全年停機總計不能超過1小時,約為53 ...

Tue Sep 24 18:50:00 CST 2019 8 3640
基於ZooKeeper大規模集群配置系統概述

基於ZooKeeper大規模集群配置系統概述 通常大型互聯網公司都擁有較大規模、結構復雜的服務器集群。隨着互聯網迅速發展,用戶訪問量以及服務器規模的越來越大,Web應用項目需要部署在數目眾多的服務集群上協同工作,才為用戶提供更可靠、穩定、優質的互聯網服務 ...

Sat Nov 05 02:54:00 CST 2011 1 15954
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM