原文:TPS低,CPU高--记一次storm压测问题排查过程

一 业务背景 系统架构 本次场景为kafka storm redis hbase,通过kafka的数据,进入storm的spout组件接收,转由storm的Bolt节点进行业务逻辑处理,最后再推送进kafka。 表数据相关的逻辑为:查询Hbase表数据,首次查询会写入redis和storm cache,再次查询,会直接从redis或cache中取值。 storm应用: 二 性能测试场景 .数据: ...

2018-01-24 15:51 0 1857 推荐指数:

查看详情

一次FGC导致CPU排查过程

今天测试团队反馈说,服务A的响应很慢,我在想,测试环境也会慢?于是我自己用postman请求了一下接口,真的很慢,竟然要2s左右,正常就50ms左右的。 于是去测试服务器看了一下,发现服务器负载很高,并且该服务A占了很高的cpu。先用top命令,看了load average,发现 ...

Mon Jun 01 18:25:00 CST 2020 4 1260
一次慢sql问题排查过程

背景说明   组织架构被拆分为多个微服务 需求: 一个输入框 查询 前后模糊查询 人员信息(工号、姓名),前后模糊查询 单位名称。 跨库平级查询!! ...

Tue Dec 21 00:56:00 CST 2021 0 1023
一次排查CPU问题

背景 将log4j.xml的日志级别从error调整为info后,进行发现CPU占用很高达到了90%多(之前也就是50%,60%的样子). 问题排查 排查思路: 看进程中的线程到底执行的是什么,导致CPU占用较高. 1. 使用top命令查看到底是哪个应用 ...

Fri Nov 05 23:34:00 CST 2021 0 435
一次OOM问题排查过程

上周运维反馈线上程序出现了OOM,程序日志中的输出为 看线程名称应该是tomcat的nio工作线程,线程在处理程序的时候因为无法在堆中分配更多内存出现了OOM,幸好JVM启动参数配置了-XX:+ ...

Thu May 02 04:05:00 CST 2019 0 3052
一次线上内存泄漏问题排查过程

近期需要对公司的接口做线上的巡查监控,需要写一个脚本放到服务器上,定时运行脚本监测线上接口是否正常。测试的接口不是HTTP协议,而是公司基于TCP协议开发的私有协议,因此不能直接用现成的一些接口测试工 ...

Mon Jul 08 22:31:00 CST 2019 0 637
一次线上崩溃问题排查过程

大家好,我是雨乐! 前几天,突然收到报警,线上服务崩溃,然后自动重启。 由于正值双十一期间,业务以稳定为主,线上服务崩溃,这可不是一件小事,赶紧登陆线上服务器,分析原因,迅速解决。 借助这篇文章,记录下整个崩溃的分析和解决过程。 收到报警 上午上班后,正在划水,突然收到邮件报警 ...

Wed Nov 10 23:54:00 CST 2021 0 811
一次容器CPU占用问题排查

起因:发现docker中有两个容器的CPU持续在百分之95以上运行了一晚上 执行命令:docker stats 发现这个两个大兄弟一点没歇满负荷跑了一晚上,再这么下去怕不是要GG 容器里跑的是JAVA应用,JDK版本1.8 首先进入容器内部:docker exec -it 容器ID /bin ...

Tue Jun 02 22:28:00 CST 2020 0 1083
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM