原文:记录一次concurrent mode failure问题排查过程以及解决思路

背景:后台定时任务脚本每天凌晨 点 会执行一个批量扫库做业务的逻辑。 gc错误日志: 借鉴于:understanding cms gc logs 得知导致concurrent mode failure的原因有是: there was not enough space in the CMS generation to promote the worst case surviving young g ...

2017-07-10 15:11 0 4011 推荐指数:

查看详情

记录一次Mysql死锁排查过程

背景以前接触到的数据库死锁,都是批量更新时加锁顺序不一致而导致的死锁,但是上周却遇到了一个很难理解的死锁。借着这个机会又重新学习了一下mysql的死锁知识以及常见的死锁场景。在多方调研以及和同事们的讨论下终于发现了这个死锁问题的成因,收获颇多。虽然是后端程序员,我们不需要像DBA一样深入地去分析 ...

Mon Feb 20 22:30:00 CST 2017 0 3701
原创 记录一次线上Mysql慢查询问题排查过程

背景 前段时间收到运维反馈,线上Mysql数据库凌晨时候出现慢查询的报警,并把原始sql发了过来: 表数据量200W左右,不是很大,而且是根据主键更新。 问题排查 排查Mysql数据库 我看到sql后第一反应就是是不是数据库出问题了,每个小时都有业务,偏偏白天业务高峰时间段 ...

Fri Mar 27 21:00:00 CST 2020 0 964
记录一次http网络超时的排查过程

微信公众号:内核小王子 觉得可以的话欢迎关注 场景:公司对外网关对很多外部商户开放,运行多年一直正常,昨天某一个客户调用我们接口的时候频繁报connectiontimeout,异常如下: 该异常来自于httpclient,原因是创建连接超时,也就是tcp进行三握手的时候失败 ...

Tue May 21 22:50:00 CST 2019 0 829
记录一次Mysql死锁排查过程

背景 以前接触到的数据库死锁,都是批量更新时加锁顺序不一致而导致的死锁,但是上周却遇到了一个很难理解的死锁。借着这个机会又重新学习了一下mysql的死锁知识以及常见的死锁场景。在多方调研以及和同事们的讨论下终于发现了这个死锁问题的成因,收获颇多。虽然是后端程序员,我们不需要像DBA一样深入 ...

Fri May 17 23:02:00 CST 2019 0 2716
记录一次Flink作业异常的排查过程

最近2周开始接手apache flink全链路监控数据的作业,包括指标统计,业务规则匹配等逻辑,计算结果实时写入elasticsearch. 昨天遇到生产环境有作业无法正常重启的问题,我负责对这个问题进行排查跟进。 第一步,基础排查 首先拿到jobmanager和taskmanager的日志 ...

Thu Jun 18 00:07:00 CST 2020 0 571
一次ygc越来越慢的问题排查过程

问题发现场景 某天突然收到线上应用的gc时间过长的告警,刚开始只有一台机器偶尔报一下,后续其他机器也纷纷告警,具体告警的阈值是应用10分钟内ygc的总时长达到了6.6s。 初步排除过程 按照gc问题常规排查流程,还是先保留现场,jmap -dump:format=b,file ...

Mon Mar 11 18:03:00 CST 2019 4 1516
一次慢sql问题排查过程

背景说明   组织架构被拆分为多个微服务 需求: 一个输入框 查询 前后模糊查询 人员信息(工号、姓名),前后模糊查询 单位名称。 跨库平级查询!! ...

Tue Dec 21 00:56:00 CST 2021 0 1023
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM