按照已确认的需求,代码都快要上线了,产品提出需求变更,匆匆改完代码上线后导致重大 bug,锅(责任)应该是研发还是产品来背呢? 工作中背锅是常态。柱哥想说:背锅不可怕,背了无数口锅还没有一点长进才是最可怕的。 下面我们聊聊如何更有效的背锅: 分锅原则 首先,我们需要明确责任原则:谁执行 ...
前言 前段时间,我们线上系统出现了一个事故:用户创建了商品,在商城的商品列表页看不到,也搜索不到。 这个问题持续了大概半个小时,最后发现竟然是我的锅。 这个事情怎么说呢,完全是我自己把自己坑了。到底怎么回事呢 . 从需求说起 . 背景 由于我们这个迭代是个大版本,上线的日子要临近了。这次上线需要运营配合提供很多商品属性的数据,他们需要把第三方的属性和我方系统的属性,在excel表格中匹配起来。 原 ...
2022-04-10 21:35 1 740 推荐指数:
按照已确认的需求,代码都快要上线了,产品提出需求变更,匆匆改完代码上线后导致重大 bug,锅(责任)应该是研发还是产品来背呢? 工作中背锅是常态。柱哥想说:背锅不可怕,背了无数口锅还没有一点长进才是最可怕的。 下面我们聊聊如何更有效的背锅: 分锅原则 首先,我们需要明确责任原则:谁执行 ...
1、事故问题: 某个旧版本业务功能中运行了一个失败重试的job,因一位离职的同事编码时未考虑周全出现死循环,导致线上从24日下午2点一直到27日晚9点持续3天一直在刷日志。异常日志内容如下: 2、事故过程分析: ①、根据异常日志 ...
> 线上用户存储数据后查看提示无权限 前言 不知道什么时候年轻的我曾一度认为Java没啥难度,没有我实现不了的需求,没有我解不了的bug 直到我遇到至今难忘的一个bug 。 线上用户存储数据后查看提示无权限 初次定位 明明自己添加的数据,为什么提示 ...
昨天下午大神把组内几十号人召集在一起开Online bug分析大会,主要是针对近期线上事故从事故原因和解决方案两个维度来分析 对金融软件来说,每一次的线上事故都有可能给公司带来重大的损失,少扣了用户的钱,为公司带来资金方面的亏损;多扣了用户的钱,则为带来不必要的合约或法律纠纷,故测试金融软件 ...
写在前面 最近,一名读者跟我说他通过浏览器访问自己的服务器时,图片显示的非常慢,以至于在浏览器中都无法完全加载出来,下载文件时,更是恼火,文件根本就无法完全下载下来。而且奇怪的是这位读者所在的 ...
最近由于在技改,发生了不少问题,前文中说的缓存穿透只是其中之一,想了想,虽然都是比较简单的问题,但是应该实际中还是有不少人碰到过,这些问题看似很简单,但是你绝对应该踩过。 ==和equals 关于 ...
发生一档子事情,公司技术团队之中有两个部门,一个开发一个运维,开发负责公司项目软件项目实现,运维负责项目运行生产环境服务器与数据的管理与维护。 前两天生产环境发生一起故障,项目依赖的redis服务器由 ...