背景 学生考试上交的场景,我们先将学生数据持久化存储到mongodb中,就告知学生上交成功。然后通过disruptor消息队列去处理后续业务逻辑。这里的上交场景会存在高并发的情况。 选型disruptor框架的原因是 其强大的单机消息处理能力,我们线上尝试使用。如果消息处理失败,则有 ...
需求:收到银行异步通知,要在 秒内将结果返回银行,同时还要根据银行返回的交易状态更新数据库订单状态和其他业务。 采用disruptor,其实最好使用独立MQ产品。本次用的是disruptor,遇到了一些问题,本文说下disruptor的问题排查。 问题 消费者不在接收队列消息。 原因:handler程序中throw e ,将异常抛给了disruptor,而我们没有设定com.lmax.disru ...
2019-01-31 16:54 0 568 推荐指数:
背景 学生考试上交的场景,我们先将学生数据持久化存储到mongodb中,就告知学生上交成功。然后通过disruptor消息队列去处理后续业务逻辑。这里的上交场景会存在高并发的情况。 选型disruptor框架的原因是 其强大的单机消息处理能力,我们线上尝试使用。如果消息处理失败,则有 ...
某个进程的内存占用情况 查找进程pid——>进入该进程的目录/proc/{pid}/。有三个文件记录了进程内存 root@ROUTER:~# ps | grep zebra 1507 ...
问题排查总结 最近一段时间 某台服务器上的一个应用总是隔一段时间就自己挂掉 用top看了看 从重新部署应用开始没有多长时间CPU占用上升得很快。top命令很快就找到了某个java进程占用过高。 排查步骤 1、使用top定位到占用cpu过高的进行PID top 2、通过ps aux ...
这个是我之前在项目组里面,有一个功能模块写了一个很复杂的sql存储过程,每次做业务都调用存储过来处理逻辑。 当多人同时做业务调用这个存储过程的时候,页面没法响应一直卡死在哪里,后面请教过专业的dba排查过问题,是存储过程里面的某部分insert,update操作导致死锁了。 现在讲排查死锁 ...
背景 在做一个微服务系统的时候,我们的参数一般都是接在通过方法定义来进行传递的,类似这样 然后这时有个模块,因为之前的设计原因,没有预留传递参数的形式,在本着尽可能不修改原来代码的情况下,决定 ...
@ 目录 OOM 问题 什么是OOM 导致OOM问题的原因 排查手段 实战 MAT分析 OOM 问题 什么是OOM OOM为out of memory的简称,来源于 ...
问题描述: 线上一个服务的突然挂了,无法被调用,查看该服务日志发现Dubbo的线程池全满了: 没有多少访问量,但是线程却猛增,猜测可能是哪里出现了死循环或者哪里发生了死锁。 首先,检测一下服务器的CPU使用量,发现在正常范围内,基本上可以排除哪里出现了死循环。 先找出该服务的进程 ...
Linux网络问题排查 用于排查Linux系统的网络故障。 网络排查一般是有一定的思路和顺序的,其实排查的思路就是根据具体的问题逐段排除故障可能发生的地方,最终确定问题。 所以首先要问一问,网络问题是什么,是不通,还是慢? 1. 如果是网络不通,要定位具体的问题,一般是不断尝试 ...