保障的經驗,分享下個人對 SRE 的理解,探討「面向產品/基礎技術的研發」和「穩定性保障」兩種角色之間的 ...
每年一次的雙十一大促臨近,因此上周末公司組織了一次技術交流閉門會,邀請了電商 物流 文娛內容 生活服務等知名一線互聯網公司的技術大牛,一起探討了一些大促穩定性保障相關的技術話題。 我作為會議主持人,也和這些技術大牛交流了很多案例經驗,從他們身上汲取了很多新的思路和技術實踐。我將其中一些比較干貨的技術實踐案例整理了出來,供大家學習參考下。 PS:出於脫敏原因,部分內容我已經做了處理,但不影響閱讀。 ...
2021-11-07 23:01 0 1244 推薦指數:
保障的經驗,分享下個人對 SRE 的理解,探討「面向產品/基礎技術的研發」和「穩定性保障」兩種角色之間的 ...
如何保障系統的穩定性 本文轉載於本人的微信公眾號中的文章,最新文章請關注右側公眾號。 目錄背景與挑戰何為系統穩定性影響系統穩定性因素如何保障系統穩定性總結 一、背景與挑戰 1. 背景 3月3日凌晨,阿里雲宕機故障 --- 驚魂三小時的故障 ...
一、穩定性的定義 二、穩定性保障的思路 2.1 核心鏈路梳理 2.2 監控能力 2.3 性能摸底、資源調優 2.4. 限流降級 2.4.預案措施 2.6 故障處理 三、保障體系 綜合以上點 穩定性保障體系框圖如下: ...
引言 2021年10月22日,在雲棲大會的《雲上運維最佳實踐》分論壇,貨拉拉技術副總監陳永庭發表了主題為“基於雲的貨拉拉技術穩定性保障實踐”的演講,為大家分享了貨拉拉在過去一段時間是如何做到技術穩定性保障的,希望給有同類型業務場景的同行提供一種思考方式。 圖:貨拉拉技術副總監陳永庭 以下 ...
簡介: 穩定性保障是個復雜的話題,需要有效、可迭代、可持續保障集群的穩定性,系統性的方法或許可以解決該問題。 作者 | 悟鵬來源 | 阿里巴巴雲原生公眾號 《Kubernetes 穩定性保障手冊》系列文章: Kubernetes 穩定性保障手冊 -- 極簡版 ...
小碼哥 於 1 月前 發表在 七嘴八舌 作者:肖飛,於2011年8月份加入京東,曾親身參與到京東的應用性能監控、統一日志、流式計算、內存緩存、四層防攻擊等一些基礎技術平台的研發和搭建工作,經歷了京東的技術系統從簡單粗放向復雜精細化的演變過程。目前主要 ...
作者 | 悟鵬 來源 | 阿里巴巴雲原生公眾號 《Kubernetes 穩定性保障手冊》系列文章: Kubernetes 穩定性保障手冊 -- 極簡版 Kubernetes 穩定性保障手冊 -- 日志專題 Kubernetes 穩定性保障手冊 -- 可觀測性專題 ...