原文:记一次log4j日志导致线上OOM问题案例

最近一个服务突然出现 OutOfMemoryError,两台服务因为这个原因挂掉了,一直在full gc。还因为这个问题我们小组吃了一个线上故障。很是纳闷,一直运行的好好的,怎么突然就不行了呢。。。 配置了一个 XX: HeapDumpOnOutOfMemoryError 该参数作用是在第一次发生OOM错误时候会打印dump内存信息 ,便开始通过dump文件开始查找问题。 项目各项环境参数: 项 ...

2018-06-30 17:01 0 873 推荐指数:

查看详情

一次 android 线上 oom 问题

背景 公司的主打产品是一款跨平台的 App,我的部门负责为它提供底层的 sdk 用于数据传输,我负责的是 Adnroid 端的 sdk 开发。 sdk 并不直接加载在 App 主进程,而是隔离在一 ...

Mon Nov 29 17:54:00 CST 2021 1 297
一次log4j日志文件输出错误的解决

log4j错误信息:log4j:ERROR Failed to rename [D:/logs/wmts_] to [D:/logs/wmts_2015-12-21.log ]. 起因:部门网站使用B/S架构请求,请求过程中需要将日志文件记录下来,以便出现问题进行查找,刚开始服务器上的日志文件 ...

Tue Dec 22 00:52:00 CST 2015 6 8899
一次ArrayList产生的线上OOM问题

前言:本以为(OutOfMemoryError)OOM问题会离我们很远,但在一次生产上线灰度的过程中就出现了Java.Lang.OutOfMemoryError:Java heap space异常,通过对线上日志的查看,最终定位到ArrayList#addAll方法中,出现这个问题的原因是 ...

Mon Jul 15 01:54:00 CST 2019 0 1138
一次线上 OOM 和性能优化

大家好,我是鸭血粉丝(大家会亲切的喊我 「阿粉」),是一位喜欢吃鸭血粉丝的程序员,回想起之前线上出现 OOM 的场景,毕竟当时是第一次遇到这么 紧脏 的大事,要好好记录下来。 1 事情回顾 在某次周五,通过 Grafana 监控,发现线上环境突然出现CPU和内存飙升的情况: 但是看到网络 ...

Thu Jan 02 05:44:00 CST 2020 1 973
OOM一次线上OOM解决全流程

一、OOM背景   疫情期间,大家都开始了远程办公。刚开始不适应,最后感觉还挺好的,不用每天挤地铁,住8平米的出租屋。   忽然有一天,系统报警邮件来了,运维也在群里艾特我,系统OOM了。其实写Java的同学如果自己负责的系统出现了OOM,是很尴尬的事情。   毕竟也是骨灰级玩家了,不慌不忙 ...

Mon Feb 24 21:03:00 CST 2020 1 1271
一次线上报错日志问题排查

今天阳光明媚,掐指一算,今天比较适合划水。 于是早上到公司之后先是蹲了厕所,然后就准备翻阅公众号推文。 看的正嗨,突然钉钉群里开始响了, 生产日志群报了一条警告,如下: 报错信息很明确 定位到业务代码如下 一个普普通通的map的put操作,怎么就报错了呢?继续往下 ...

Thu Apr 01 23:06:00 CST 2021 21 1547
log4j导致的性能问题

问题背景   双十一零点时,有一个服务A(后文该服务都用A来代替)的tp99由平常的50ms左右突然彪到60000ms,导致调用端积累了几十W的数据,同时,也影响到了同一个docker上的其他服务。那为什么会出现这种问题呢,且看下面排查过程。 问题分析   1、将一台docker上其他服务 ...

Thu Dec 29 02:07:00 CST 2016 0 8446
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM