作者 | 悟鵬 來源|阿里巴巴雲原生公眾號 前言 在技術工作中,對於產品/基礎技術研發和 SRE 兩種角色,通常會有基於「是否側重編碼」的理解。對於產品研發轉做 SRE ,經常會產生是否要「脫離編碼工作」的看法,或者認為是否要「偏離對產品/基礎技術的推進」。 基於過往的技術研發和穩定性 ...
引言 年 月 日,在雲棲大會的 雲上運維最佳實踐 分論壇,貨拉拉技術副總監陳永庭發表了主題為 基於雲的貨拉拉技術穩定性保障實踐 的演講,為大家分享了貨拉拉在過去一段時間是如何做到技術穩定性保障的,希望給有同類型業務場景的同行提供一種思考方式。 圖:貨拉拉技術副總監陳永庭 以下是根據他的演講整理成的文章,主要分為四個部分: 一 貨拉拉業務形態。 二 基礎架構治理。 三 技術保障能力的建設。 四 跨雲 ...
2021-11-04 11:54 0 135 推薦指數:
作者 | 悟鵬 來源|阿里巴巴雲原生公眾號 前言 在技術工作中,對於產品/基礎技術研發和 SRE 兩種角色,通常會有基於「是否側重編碼」的理解。對於產品研發轉做 SRE ,經常會產生是否要「脫離編碼工作」的看法,或者認為是否要「偏離對產品/基礎技術的推進」。 基於過往的技術研發和穩定性 ...
每年一次的雙十一大促臨近,因此上周末公司組織了一次技術交流閉門會,邀請了電商、物流、文娛內容、生活服務等知名一線互聯網公司的技術大牛,一起探討了一些大促穩定性保障相關的技術話題。 我作為會議主持人,也和這些技術大牛交流了很多案例經驗,從他們身上汲取了很多新的思路和技術實踐。我將其中一 ...
如何保障系統的穩定性 本文轉載於本人的微信公眾號中的文章,最新文章請關注右側公眾號。 目錄背景與挑戰何為系統穩定性影響系統穩定性因素如何保障系統穩定性總結 一、背景與挑戰 1. 背景 3月3日凌晨,阿里雲宕機故障 --- 驚魂三小時的故障 ...
一、穩定性的定義 二、穩定性保障的思路 2.1 核心鏈路梳理 2.2 監控能力 2.3 性能摸底、資源調優 2.4. 限流降級 2.4.預案措施 2.6 故障處理 三、保障體系 綜合以上點 穩定性保障體系框圖如下: ...
https://blog.csdn.net/paolei/article/details/94390330 背景簡介 對於大型應用后台系統來說,穩定性至關重要。目前越來越多的大型應用系統采用微服務架構,更加需要關注穩定性的技術能力建設。穩定性是服務系統基礎能力的體現。 基礎知識 ...
本文轉載於本人的微信公眾號中的文章,最新文章請關注右側公眾號。 目錄背景與挑戰何為系統穩定性影響系統穩定性因素如何保障系統穩定性總結 一、背景與挑戰 1. 背景 3月3日凌晨,阿里雲宕機故障 --- 驚魂三小時的故障,讓華北地區不少公司的APP、網站和內部系統紛紛癱瘓。消息瞬間占領 ...
簡介: 穩定性保障是個復雜的話題,需要有效、可迭代、可持續保障集群的穩定性,系統性的方法或許可以解決該問題。 作者 | 悟鵬來源 | 阿里巴巴雲原生公眾號 《Kubernetes 穩定性保障手冊》系列文章: Kubernetes 穩定性保障手冊 -- 極簡版 ...