原文:Google SRE 读书笔记 扒一扒SRE用的那些工具

写在前面 最近花了一点时间阅读了 SRE Goolge运维解密 这本书,对于书的内容大家可以看看豆瓣上的介绍。总体而言,这本书是首次比较系统的披露Google内部SRE运作的一些指导思想 实践以及相关的问题,对于我们运维乃至开发人员都有一定的借鉴意义。 书中的一些思想也令我印象深刻,例如SRE工程师要保证投入 的时间在项目上 错误预算 命运之轮 事故总结等等,对于从业者有很大的启发。书中提到了很多 ...

2018-04-21 15:22 0 4904 推荐指数:

查看详情

SRE实战手册》学习笔记之认识SRE

前言 我自己一直是专注在性能测试和稳定性保障领域的,因此买了很多相关的技术课程学习。 极客时间上赵成老师的《SRE实战手册》是线上稳定性保障领域很好的一门技术课程。 这篇文章是我将学习过程总结的内容还有部分自己的思考做了提炼总结,供大家参考。 课程链接 ...

Sun Feb 13 21:57:00 CST 2022 0 925
SRE实战手册》学习笔记SRE落地实践

前言 前面介绍了SRE的基础,包括SLI和SLO以及Error Budget(错误预算)。其中: SLI是衡量系统稳定性的指标; SLO是每个指标对应的衡量目标; SLO转化为错误预算(更直观便与量化); 转化后做稳定性提升保障工作,就是想办法不要把错误预算 ...

Tue Feb 15 06:37:00 CST 2022 0 945
SRE实战手册》学习笔记之切入SRE

前言 这篇文章是《SRE实战手册》学习笔记的第二篇,理解SRE之后,就要找到切入点来落地。 理解SRE中的指标和目标 SRE强调稳定性,一般是看整体的系统情况,也就是常说的"3个9"、"4个9"这样可量化的数字。 这个“确定成功请求条件,设定达成占比目标”的过程 ...

Mon Feb 14 08:24:00 CST 2022 0 707
如何做监控?Google SRE 解密

监控值班室: @隔壁老王头 SQL执行耗时时间过长,达到了报警阈值【5000ms】 隔壁老王头: @监控值班室 少量报警请忽略,批量关注即可。 监控值班室: ...

Sat Apr 04 17:52:00 CST 2020 0 768
ELF文件

ELF文件(Executable Linkable Format)是一种文件存储格式。Linux下的目标文件和可执行文件都按照该格式进行存储,有必要做个总结。 目录 ...

Sun Jan 31 07:03:00 CST 2021 0 517
如何优雅的网站——工具

在上一篇文章里本人介绍了网站的入门知识。可以说是仿站的必备知识。不过,在实战中没必要所有的页面都要全部手动去操作处理,完全可以借助大牛们写好的工具。网上搜索仿站工具工具能找到一堆,我就不一一介绍了。今天就分为两个部分来讲一讲工具,第一部分是针对单页面 ...

Sat Jan 13 01:03:00 CST 2018 1 26605
什么是SRESRE需要具备什么能力?

对于SRE一词,想必大家已经不陌生了,满世界都在讲SRE,但是SRE到底是个什么角色?负责哪些工作呢?今天来给大家解惑一下。 SRE最早是由Google提出的概念,其大概的意思就是:以标准化、自动化、可扩展驱动维护,用软件开发解决运维难题。这个岗位面世的时候,其根本要解决的问题就是打破 ...

Fri Nov 12 18:10:00 CST 2021 0 1556
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM