原文:【MySQL】记一次线上重大事故:二狗子竟然把线上数据库删了!!

写在前面 估计二狗子这几天是大姨夫来了,心情很郁闷,情绪也很低落,工作的时候也有点心不在焉。让他发个版本,结果,一行命令下去把线上的数据库删了 你没听错:是删掉了线上的数据库 运营那边顿时炸了锅:怎么回事 系统不能访问了 什么情况啊 很多客户都在投诉了 尽管运营那边慌慌张张的不知所措,但是,我们作为技术人员还是要淡定,不就是删了数据库吗 没事,哥帮你搞定 如果文章对你有点帮助,请微信搜索并关注 冰 ...

2020-08-19 22:36 1 1247 推荐指数:

查看详情

一次线上MySQL数据库死锁问题

最近线上项目报了一个MySQL死锁(DealLock)错误,虽说对业务上是没有什么影响的,由于自己对数据库锁这块了解不是很多,之前也没怎么的在线上碰到过。这次刚好遇到了,便在此记录一下。 出现死锁问题背景 项目层面:报错的项目 ...

Wed Jun 27 07:55:00 CST 2018 0 787
一次线上事故的JVM内存学习

今天线上的hadoop集群崩溃了,现象是namenode一直在GC,长时间无法正常服务。最后运维大神各种倒腾内存,GC稳定后,服务正常。虽说全程在打酱油,但是也跟着学习不少的东西。 第一个问题:为什么会频繁GC 有过JVM经验的开发者都应该知道,GC是在内存不够时,JVM自动进行 ...

Fri May 25 04:24:00 CST 2018 0 1054
一次dirty_ratio引起的线上事故

故障时间轴 发生时间:2020-09-14 06:40 发现时间:2020-09-14 06:41 响应时间:2020-09-14 07:42 故障表现 磁盘> ...

Mon Sep 14 21:12:00 CST 2020 0 431
一次一个枚举引发线上事故风暴

背景 2018年8月15号下午6点左右一个我们服务的调用方通知我们他们在调用服务接口时出现了大量的异常和通知,并且错误返回值都是“显示未设置结束日期” 问题定位 收到调用方的消息后,我立即展 ...

Fri Aug 17 00:39:00 CST 2018 6 806
一次线上事故的处理流程和总结

1、事故问题: 某个旧版本业务功能中运行了一个失败重试的job,因一位离职的同事编码时未考虑周全出现死循环,导致线上从24日下午2点一直到27日晚9点持续3天一直在刷日志。异常日志内容如下: 2、事故过程分析: ①、根据异常日志 ...

Tue Jul 31 18:00:00 CST 2018 0 1408
ThreadLocal引起的一次线上事故

> 线上用户存储数据后查看提示无权限 前言 不知道什么时候年轻的我曾一度认为Java没啥难度,没有我实现不了的需求,没有我解不了的bug 直到我遇到至今难忘的一个bug 。 线上用户存储数据后查看提示无权限 初次定位 明明自己添加的数据,为什么提示 ...

Fri May 14 16:48:00 CST 2021 3 766
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM