原文:货拉拉技术副总监陈永庭:基于公共云的技术稳定性保障实践

引言 年 月 日,在云栖大会的 云上运维最佳实践 分论坛,货拉拉技术副总监陈永庭发表了主题为 基于云的货拉拉技术稳定性保障实践 的演讲,为大家分享了货拉拉在过去一段时间是如何做到技术稳定性保障的,希望给有同类型业务场景的同行提供一种思考方式。 图:货拉拉技术副总监陈永庭 以下是根据他的演讲整理成的文章,主要分为四个部分: 一 货拉拉业务形态。 二 基础架构治理。 三 技术保障能力的建设。 四 跨云 ...

2021-11-04 11:54 0 135 推荐指数:

查看详情

这是阿里技术专家对 SRE 和稳定性保障的理解

作者 | 悟鹏 来源|阿里巴巴原生公众号 前言 在技术工作中,对于产品/基础技术研发和 SRE 两种角色,通常会有基于「是否侧重编码」的理解。对于产品研发转做 SRE ,经常会产生是否要「脱离编码工作」的看法,或者认为是否要「偏离对产品/基础技术的推进」。 基于过往的技术研发和稳定性 ...

Tue Jan 26 02:43:00 CST 2021 0 362
双11在即,分享一些稳定性保障技术干货

每年一次的双十一大促临近,因此上周末公司组织了一次技术交流闭门会,邀请了电商、物流、文娱内容、生活服务等知名一线互联网公司的技术大牛,一起探讨了一些大促稳定性保障相关的技术话题。 我作为会议主持人,也和这些技术大牛交流了很多案例经验,从他们身上汲取了很多新的思路和技术实践。我将其中一 ...

Mon Nov 08 07:01:00 CST 2021 0 1244
保障系统的稳定性

如何保障系统的稳定性 本文转载于本人的微信公众号中的文章,最新文章请关注右侧公众号。 目录背景与挑战何为系统稳定性影响系统稳定性因素如何保障系统稳定性总结 一、背景与挑战 1. 背景 3月3日凌晨,阿里宕机故障 --- 惊魂三小时的故障 ...

Thu Mar 21 22:12:00 CST 2019 0 670
服务稳定性保障思路

一、稳定性的定义 二、稳定性保障的思路 2.1 核心链路梳理 2.2 监控能力 2.3 性能摸底、资源调优 2.4. 限流降级 2.4.预案措施 2.6 故障处理 三、保障体系 综合以上点 稳定性保障体系框图如下: ...

Tue Aug 07 16:36:00 CST 2018 0 1277
大型网站后台稳定性技术策略

https://blog.csdn.net/paolei/article/details/94390330 背景简介   对于大型应用后台系统来说,稳定性至关重要。目前越来越多的大型应用系统采用微服务架构,更加需要关注稳定性技术能力建设。稳定性是服务系统基础能力的体现。   基础知识 ...

Wed Oct 16 04:44:00 CST 2019 0 335
阿里宕机故障 - 思考如何保障系统的稳定性

本文转载于本人的微信公众号中的文章,最新文章请关注右侧公众号。 目录背景与挑战何为系统稳定性影响系统稳定性因素如何保障系统稳定性总结 一、背景与挑战 1. 背景 3月3日凌晨,阿里宕机故障 --- 惊魂三小时的故障,让华北地区不少公司的APP、网站和内部系统纷纷瘫痪。消息瞬间占领 ...

Mon Mar 18 18:34:00 CST 2019 7 1424
Kubernetes 稳定性保障手册:洞察+预案

简介: 稳定性保障是个复杂的话题,需要有效、可迭代、可持续保障集群的稳定性,系统性的方法或许可以解决该问题。 作者 | 悟鹏来源 | 阿里巴巴原生公众号 《Kubernetes 稳定性保障手册》系列文章:​ Kubernetes 稳定性保障手册 -- 极简版 ...

Wed May 26 21:50:00 CST 2021 0 213
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM