原文:记一次OOM问题排查过程

上周运维反馈线上程序出现了OOM,程序日志中的输出为 看线程名称应该是tomcat的nio工作线程,线程在处理程序的时候因为无法在堆中分配更多内存出现了OOM,幸好JVM启动参数配置了 XX: HeapDumpOnOutOfMemoryError,使用MAT打开拿到的hprof文件进行分析。 第一步就是打开Histogram看看占用内存最大的是什么对象: 可以看到byte数组占用了接近JVM配置的 ...

2019-05-01 20:05 0 3052 推荐指数:

查看详情

一次慢sql问题排查过程

背景说明   组织架构被拆分为多个微服务 需求: 一个输入框 查询 前后模糊查询 人员信息(工号、姓名),前后模糊查询 单位名称。 跨库平级查询!! ...

Tue Dec 21 00:56:00 CST 2021 0 1023
一次线上内存泄漏问题排查过程

近期需要对公司的接口做线上的巡查监控,需要写一个脚本放到服务器上,定时运行脚本监测线上接口是否正常。测试的接口不是HTTP协议,而是公司基于TCP协议开发的私有协议,因此不能直接用现成的一些接口测试工 ...

Mon Jul 08 22:31:00 CST 2019 0 637
一次线上崩溃问题排查过程

大家好,我是雨乐! 前几天,突然收到报警,线上服务崩溃,然后自动重启。 由于正值双十一期间,业务以稳定为主,线上服务崩溃,这可不是一件小事,赶紧登陆线上服务器,分析原因,迅速解决。 借助这篇文章,记录下整个崩溃的分析和解决过程。 收到报警 上午上班后,正在划水,突然收到邮件报警 ...

Wed Nov 10 23:54:00 CST 2021 0 811
MySQL-一次备份失败的排查过程

山竹来临,窝在家里整理个人文档。 本篇文章主要讲解排查问题的思路,涉及linux 删除文件的原理、实例误删数据恢复、MySQL实例初始化参数优先级别等,虽然涉及知识点比较浅,但是个人觉得挺有 ...

Thu Sep 20 17:48:00 CST 2018 0 2438
一次Xmrig挖矿木马排查过程

问题现象 Linux 服务器收到报警信息,主机 CPU 跑满。 自动创建运行 Docker 容器 xmrig, 导致其他运行中容器被迫停止。 问题原因 通过 top 命令可以看到有一个 xmrig 进程占用了99%的 CPU。 经定位,该进程是一个挖矿木马程序,通过上述截图 ...

Thu Jun 27 00:27:00 CST 2019 0 1750
一次Xmrig挖矿木马排查过程

问题现象 Linux 服务器收到报警信息,主机 CPU 跑满。 自动创建运行 Docker 容器 xmrig, 导致其他运行中容器被迫停止。 问题原因 通过 top 命令可以看到有一个 xmrig 进程占用了99%的 CPU。 经定位,该进程是一个挖矿 ...

Sat Aug 18 19:23:00 CST 2018 0 1089
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM