原文:【运维】记一次上线前的紧急定位与修复-献上九条小经验

简介 本文介绍了作者所在团队在某次上线前测试发现问题 定位问题并修复上线的过程,最后给出几点经验总结,希望对大家有用。 过程 今天需要上线,但昨晚才合并了所有分支,时间很紧迫。不幸的是,打包测试后发现有一个Springboot应用 模块R 启动失败,但进程没有死,一直在输出报错日志。 Google了相关的报错日志,并没有找到相关信息。查看了模块R的代码变更,并没有什么改动,以为是环境问题 部署到 ...

2019-11-14 08:28 0 377 推荐指数:

查看详情

一次Drone无法触发构建的问题定位与处理

问题 好巧不巧,当你晚上准备上线的时候,在下午临近下班的时候CICD工具出问题了,提交代码不能触发构建,不能上线了,Drone那边负责人也下班了,正好CICD关联的公司git仓库也出问题了(就是上次Drone构建失败被误会的部门),我们的构建服务也没有相关的报错日志,就顺水推锅取消了上线 ...

Fri Mar 05 21:53:00 CST 2021 0 417
惊魂web应用宕机一次网站的紧急恢复

  这次网站的故障出现的比较突然,没有任何防备,有种突如其来的感觉。这是一台阿里云服务器,采用wdcp的nginx+apache+mysql的方式运行。一位同事在对web目录进行压缩后,由于web目录 ...

Wed Jul 08 23:30:00 CST 2015 8 2400
一次LVM修复过程

进行以下操作好好搜搜资料,我提供的资料只是供参考理解。数据很重要!!! 写在前面:创建lv的时候,建议在pv上留一些空间。 关键属于:pv 物理卷,vg 卷组, lv逻辑卷。 也就是说:lvm把一堆硬盘组成一个硬盘组,然后再上面再进一步分逻辑卷。好处是扩展方便。坏处就是我遇到的坏处 ...

Sun Oct 22 03:34:00 CST 2017 0 3180
一次uboot编译/经验/教训

一次uboot编译/经验/教训 - 最近学习uboot移植有关的知识,在了解原理后自己编译uboot,但是出现了好多各式各样的错误,最后换了几次系统环境之后才找到错误来源 1.准备源码与交叉编译工具链 环境:ubuntu19.04虚拟机 首先从linux公社下载 ...

Thu Mar 19 22:44:00 CST 2020 0 601
一次jstack命令定位问题

今天天气不错,但是赶上恶意加班心情就不爽,怀着不爽的心情干活,总能创造出更多的问题,这不,今天就自己挖了一个坑,自己跳进去了,好在上来了 经过是这样的,开始调试canal采集binlog时,由于添加 ...

Sun Mar 14 01:01:00 CST 2021 0 279
一次定位zookeeper连接不上的问题

起因,想起来分布式锁也是常考的知识点,自己还不是太熟,就想着在网上找个demo学学 找到了一个看上去还不错的,他使用的是ZkClient这个客户端。 由于我之前在工程里测试过kafka,而kafk ...

Wed Jan 13 03:11:00 CST 2021 0 598
一次历时六小时的上线经历

  这是农历去年(阳历2016.1.29)的事了。公司的一个项目已开发得七七八八了,要准备上线了。项目经理与公司领导及用户协商,定于2016.1.28日(周四)上线。但这天由于项目经理需要去机场接人,加上组同事也忙着。就推后一天上线。这里就不得不谈下公司的项目从开发到上线的过程:公司项目分开 ...

Mon Feb 15 19:08:00 CST 2016 22 4320
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM