原文:Kafka 异步消息也会阻塞?记一次 Dubbo 频繁超时排查过程

线上某服务 A 调用服务 B 接口完成一次交易,一次晚上的生产变更之后,系统监控发现服务 B 接口频繁超时,后续甚至返回线程池耗尽错误 Thread pool is EXHAUSTED。因为服务 B 依赖外部接口,刚开始误以为外部接口延时导致,所以临时增加服务 B dubbo 线程池线程数量。配置变更之后,重启服务,服务恢复正常。一段时间之后,服务 B 再次返回线程池耗尽错误。这次深入排查问题之 ...

2019-10-08 20:32 6 2697 推荐指数:

查看详情

一次频繁Full GC问题排查过程分享

问题描述 应用收到频繁Full GC告警 问题排查 登录到对应机器上去,查看GC日志,发现YGC一分钟已经达到了15,比Full GC还要频繁一些,其中Full GC平均10分钟超过了4,如下图 使用jstat -gcutil 5280 1000查看实时GC情况 ...

Wed Nov 07 17:31:00 CST 2018 4 8013
一次redis读取超时排查过程(SADD惹的祸)

问题背景 在业务使用redis过程中,出现了read timeout 的异常。 问题排查 直接原因 运维查询redis慢查询日志,发现在异常时间节点,有redis慢查询日志,执行sadd 命令花费了1秒钟。但由于redis是单线程应用,执行单条命令的阻塞,会造成其他命令的排队等候,导致 ...

Wed Jul 03 01:03:00 CST 2019 0 890
一次线上接口超时排查过程

1、事件还原 昨天下午,收到一个504的告警,显然这是一个超时告警。当时由于手头有其他事情,没在意,就只是瞄了一眼,但是引起告警的方法很熟悉,是我写的,第一反应有点诧异。 诧异之后,继续处理手头的工作。 一小时过后,又收到同样的告警,显然不是偶尔,肯定是哪儿出问题了,于是开始排查。 报警 ...

Sun Sep 29 08:17:00 CST 2019 2 1588
记录一次http网络超时排查过程

微信公众号:内核小王子 觉得可以的话欢迎关注 场景:公司对外网关对很多外部商户开放,运行多年一直正常,昨天某一个客户调用我们接口的时候频繁报connectiontimeout,异常如下: 该异常来自于httpclient,原因是创建连接超时,也就是tcp进行三握手的时候失败 ...

Tue May 21 22:50:00 CST 2019 0 829
MySQL-一次备份失败的排查过程

山竹来临,窝在家里整理个人文档。 本篇文章主要讲解排查问题的思路,涉及linux 删除文件的原理、实例误删数据恢复、MySQL实例初始化参数优先级别等,虽然涉及知识点比较浅,但是个人觉得挺有 ...

Thu Sep 20 17:48:00 CST 2018 0 2438
一次慢sql问题排查过程

背景说明   组织架构被拆分为多个微服务 需求: 一个输入框 查询 前后模糊查询 人员信息(工号、姓名),前后模糊查询 单位名称。 跨库平级查询!! ...

Tue Dec 21 00:56:00 CST 2021 0 1023
一次OOM问题排查过程

上周运维反馈线上程序出现了OOM,程序日志中的输出为 看线程名称应该是tomcat的nio工作线程,线程在处理程序的时候因为无法在堆中分配更多内存出现了OOM,幸好JVM启动参数配置了-XX:+ ...

Thu May 02 04:05:00 CST 2019 0 3052
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM