原文:分享一次Linux任务计划crontab不执行的问题排查过程

转载于:https: zhangge.net .html 朋友弄了一个小项目,要我帮忙做下 Linux 系统运维,上线一段时间后,发现项目偶尔会挂掉导致服务不可用。开发朋友一时之间也没空去研究项目奔溃的根因,只好由我这个运维先写一个项目进程自拉起脚本,通过 Linux 任务计划每分钟检查一下进程是否存在来避免项目挂了没人管的情况。 自拉起脚本很简单,随便写几行就搞定了: Shell bin bas ...

2018-07-31 10:17 0 2619 推荐指数:

查看详情

一次频繁Full GC问题排查过程分享

问题描述 应用收到频繁Full GC告警 问题排查 登录到对应机器上去,查看GC日志,发现YGC一分钟已经达到了15,比Full GC还要频繁一些,其中Full GC平均10分钟超过了4,如下图 使用jstat -gcutil 5280 1000查看实时GC情况 ...

Wed Nov 07 17:31:00 CST 2018 4 8013
一次ygc越来越慢的问题排查过程

问题发现场景 某天突然收到线上应用的gc时间过长的告警,刚开始只有一台机器偶尔报一下,后续其他机器也纷纷告警,具体告警的阈值是应用10分钟内ygc的总时长达到了6.6s。 初步排除过程 按照gc问题常规排查流程,还是先保留现场,jmap -dump:format=b,file ...

Mon Mar 11 18:03:00 CST 2019 4 1516
一次慢sql问题排查过程

背景说明   组织架构被拆分为多个微服务 需求: 一个输入框 查询 前后模糊查询 人员信息(工号、姓名),前后模糊查询 单位名称。 跨库平级查询!! ...

Tue Dec 21 00:56:00 CST 2021 0 1023
一次OOM问题排查过程

上周运维反馈线上程序出现了OOM,程序日志中的输出为 看线程名称应该是tomcat的nio工作线程,线程在处理程序的时候因为无法在堆中分配更多内存出现了OOM,幸好JVM启动参数配置了-XX:+ ...

Thu May 02 04:05:00 CST 2019 0 3052
一次线上内存泄漏问题排查过程

近期需要对公司的接口做线上的巡查监控,需要写一个脚本放到服务器上,定时运行脚本监测线上接口是否正常。测试的接口不是HTTP协议,而是公司基于TCP协议开发的私有协议,因此不能直接用现成的一些接口测试工 ...

Mon Jul 08 22:31:00 CST 2019 0 637
一次线上崩溃问题排查过程

大家好,我是雨乐! 前几天,突然收到报警,线上服务崩溃,然后自动重启。 由于正值双十一期间,业务以稳定为主,线上服务崩溃,这可不是一件小事,赶紧登陆线上服务器,分析原因,迅速解决。 借助这篇文章,记录下整个崩溃的分析和解决过程。 收到报警 上午上班后,正在划水,突然收到邮件报警 ...

Wed Nov 10 23:54:00 CST 2021 0 811
一次故障排查过程

上周晚上,某环境 ES 出现阻塞, 运行缓慢。于是开始排查问题过程。 开始 思路:现象是阻塞,通常是 CPU 彪高,导致业务线程分配不到 CPU 时间片,或者内存吃紧,频繁 GC 导致的 STW。 登录到目标服务器,由于 ES 的用户不是 LZ,因此找运维要了 root 权限,登录到服务器 ...

Fri Jan 25 20:50:00 CST 2019 2 969
一次奇怪的的bug排查过程

公司对底层基础库进行了重构,线上稳定跑了几天,在查看订单系统的log时,有几条error信息非常的奇怪, 订单有状态机进行维护 已经被撤消的订单不能再进行有其他操作,和状态更改。 已经支付的订单,不能被撤消,只能退款或者部分退款。 这两条log虽然没有太大问题,关键问题 ...

Tue Nov 30 18:00:00 CST 2021 2 1723
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM