原文:Google SRE 讀書筆記 扒一扒SRE用的那些工具

寫在前面 最近花了一點時間閱讀了 SRE Goolge運維解密 這本書,對於書的內容大家可以看看豆瓣上的介紹。總體而言,這本書是首次比較系統的披露Google內部SRE運作的一些指導思想 實踐以及相關的問題,對於我們運維乃至開發人員都有一定的借鑒意義。 書中的一些思想也令我印象深刻,例如SRE工程師要保證投入 的時間在項目上 錯誤預算 命運之輪 事故總結等等,對於從業者有很大的啟發。書中提到了很多 ...

2018-04-21 15:22 0 4904 推薦指數:

查看詳情

SRE實戰手冊》學習筆記之認識SRE

前言 我自己一直是專注在性能測試和穩定性保障領域的,因此買了很多相關的技術課程學習。 極客時間上趙成老師的《SRE實戰手冊》是線上穩定性保障領域很好的一門技術課程。 這篇文章是我將學習過程總結的內容還有部分自己的思考做了提煉總結,供大家參考。 課程鏈接 ...

Sun Feb 13 21:57:00 CST 2022 0 925
SRE實戰手冊》學習筆記SRE落地實踐

前言 前面介紹了SRE的基礎,包括SLI和SLO以及Error Budget(錯誤預算)。其中: SLI是衡量系統穩定性的指標; SLO是每個指標對應的衡量目標; SLO轉化為錯誤預算(更直觀便與量化); 轉化后做穩定性提升保障工作,就是想辦法不要把錯誤預算 ...

Tue Feb 15 06:37:00 CST 2022 0 945
SRE實戰手冊》學習筆記之切入SRE

前言 這篇文章是《SRE實戰手冊》學習筆記的第二篇,理解SRE之后,就要找到切入點來落地。 理解SRE中的指標和目標 SRE強調穩定性,一般是看整體的系統情況,也就是常說的"3個9"、"4個9"這樣可量化的數字。 這個“確定成功請求條件,設定達成占比目標”的過程 ...

Mon Feb 14 08:24:00 CST 2022 0 707
如何做監控?Google SRE 解密

監控值班室: @隔壁老王頭 SQL執行耗時時間過長,達到了報警閾值【5000ms】 隔壁老王頭: @監控值班室 少量報警請忽略,批量關注即可。 監控值班室: ...

Sat Apr 04 17:52:00 CST 2020 0 768
ELF文件

ELF文件(Executable Linkable Format)是一種文件存儲格式。Linux下的目標文件和可執行文件都按照該格式進行存儲,有必要做個總結。 目錄 ...

Sun Jan 31 07:03:00 CST 2021 0 517
如何優雅的網站——工具

在上一篇文章里本人介紹了網站的入門知識。可以說是仿站的必備知識。不過,在實戰中沒必要所有的頁面都要全部手動去操作處理,完全可以借助大牛們寫好的工具。網上搜索仿站工具工具能找到一堆,我就不一一介紹了。今天就分為兩個部分來講一講工具,第一部分是針對單頁面 ...

Sat Jan 13 01:03:00 CST 2018 1 26605
什么是SRESRE需要具備什么能力?

對於SRE一詞,想必大家已經不陌生了,滿世界都在講SRE,但是SRE到底是個什么角色?負責哪些工作呢?今天來給大家解惑一下。 SRE最早是由Google提出的概念,其大概的意思就是:以標准化、自動化、可擴展驅動維護,用軟件開發解決運維難題。這個崗位面世的時候,其根本要解決的問題就是打破 ...

Fri Nov 12 18:10:00 CST 2021 0 1556
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM