原文:记一次自动恢复的支付故障

故障描述 作为一个老牌OTA公司,公司早些年订单主要来源是PC网站和呼叫中心。我在入职公司大约半年后,遇到一次非常诡异的故障。有一天早上,大概也是这个季节,阳光明媚,程序猿刚起床,洗洗涮涮,准备去迎接初恋般的工作日,却突然收到一大堆报警,线上消息队列大量积压 当然,我还是一如既往的非常勤奋地在 点之前就到公司的 但是作为一名新员工,环视四周,组内其他员工都还没到公司,运维也都在路上,故障就这样突然 ...

2019-05-09 13:02 23 2963 推荐指数:

查看详情

一次mysql故障恢复

事情要从俩月前的一个坑说起,一台新的测试服务器,新项目一元夺宝用的。 配置aws上的一台云主机,系统盘8G,一块300G的云硬盘。 拿到机器后,另一运维小哥安装php,nginx,mysql等软件 ...

Wed Dec 07 01:44:00 CST 2016 0 2076
一次IE代理异常故障

原由:S.S.R完事儿之后IE代理总是自动勾选。无论怎么修改注册表都无济于事。且通过Process Explorer监测到任意app都可以自动触发IE代理开启。 强势禁用: 编辑注册表:HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services ...

Thu Feb 27 16:38:00 CST 2020 0 841
一次keepalived和VIP导致的故障

起因 nginx服务器采用的keepalived+vip实现的双活,最近由于一台服务器有问题,更换了一台nginx: 操作: 停止有问题服务器keepalived和nginx 新服务器 ...

Thu Aug 27 18:33:00 CST 2020 0 1438
一次ceph集群的严重故障

问题:集群状态,坏了一个盘,pg状态好像有点问题[root@ceph-1 ~]# ceph -s cluster 72f44b06-b8d3-44cc-bb8b-2048f5b4acfe ...

Wed Jan 02 23:44:00 CST 2019 0 5801
一次Postgres CPU爆满故障

问题描述 公司项目测试环境调用某些接口的时候,服务器立即崩溃,并一定时间内无法提供服务。 问题排查 服务器配置不够 第一反应是服务器需要升配啦,花钱解决一切!毕竟测试服务器配置确实不高,2CP ...

Tue Feb 11 04:03:00 CST 2020 1 1136
一次yum被误删恢复

系统: 首先执行yum安装发现报错: 检查发现没有yum安装: 好吧,从阿里找对应系统的rpm包来安装,因为可以访问外网,直接下载了:参考:htt ...

Wed Apr 10 05:11:00 CST 2019 0 574
一次mysql数据恢复

确切的说更像是一次数据迁移。 背景介绍: 操作系统:Windows Server 2008 R2 数据库版本:MySQL 5.5 数据库的安装目录与数据文件目录不在同一个磁盘,数据文件所在的目录磁盘损坏。而后通过数据恢复工具恢复 ...

Sat Jan 21 23:50:00 CST 2017 0 8305
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM