原文:记录一次mongodb因网络问题导致shard节点异常

现象: 机房反馈 点左右,机房交换机故障,导致网络出现问题 业务人员反馈某个接口超时 初查:通过业务日志查看分析发现,在连接mongo的某个collections时候,报错错误如下: 在写入数据的时候报错: 因此初步确定问题出在mongo分片集群上 进入mongos节点,进行findOne操作,提示如下: 查看shard信息: 没有发现异常,然后挨个检查shard节点日志 发现在shard 节点的 ...

2018-12-10 13:33 0 1398 推荐指数:

查看详情

记录一次并发导致数据重复创建的问题

这事第一个版本的代码逻辑,通过数据库中是否有纪录来防止重复创建 但是测试MM发现创建了2条纪录,查询日志发现:第一次请求在写入数据库之前,第二请求已经执行过了判断逻辑,所以并没有查询到写入纪录,从而导致重复创建。 解决方案,加入分布式锁,第二个版本代码如下 经过此次修改,以为解决 ...

Sat Feb 03 01:04:00 CST 2018 0 1147
记录一次idea的git导致的macpro风扇狂转问题

现象 macpro风扇忽然狂转不停;使用软件Macs Fan Control检测如下:cpu温度持续过高(超过50度),风扇当前转速比较高 解决 观察cpu使用情况,发现git占用cpu很高, ...

Sat Jul 20 01:09:00 CST 2019 0 717
记录一次TraceId的问题

多服务部署的时候,各个服务通过httpClient进行调用时候,有时候出现问题,需要进行追查。但是如果没有一个标记,就会很迷茫,特别是多个服务来回调用,就无法快速定位问题。这个时候一般是使用MDC的 traceId来追踪。但是由于每个服务的traceId ...

Wed Aug 21 19:03:00 CST 2019 0 1055
记录一次问题排查

1. 问题描述:早上刚来上班,业务部门同事反应管理后台无法登录 2. 问题排查定位 2.1 服务器排查 a. 接口是否可以调通:首先自己登陆后台,发现时好时坏,偶尔接口返回【系统忙】。我们系统接口异常调不通会返回系统忙 b. 服务是否死掉或者假死:连接服务器->查看Java ...

Tue Aug 03 02:08:00 CST 2021 0 260
记录一次句柄泄漏的异常解决

最近入职了一家生产机器人的公司,我们做的软件就是运行在这个机器人上的,机器人服务有个特点就是里面的软件要连续24小时不间断服务,所以要求app能够持续的运行服务。 测试那边很久以前就记录过一个奇异的问题,就是机器人在使用一天以后,会莫名奇妙的闪退,java层有crashhandler,但是也抓 ...

Sat Aug 18 00:30:00 CST 2018 2 5905
一次SpringAOP环绕通知导致全局异常抓取失效的问题

背景 在web开发过程中,我们每个项目都必然会主动或者被动的抛出各种各样的异常,那么如果抛出到最上层还没有捕获,那么就会导致程序停止。所以,一般我们在开发中都会使用全局异常捕获机制,捕获各种各样的异常,最后返回统一的结果实体类给调用方。 另一方面,我们在使用spring框架开发的过程中 ...

Wed Sep 30 02:07:00 CST 2020 0 1394
一次ElasticSearch重启之后shard未分配问题的解决

一次ElasticSearch重启之后shard未分配问题的解决 环境 ElasticSearch6.3.2,三节点集群 Ubuntu16.04 一个名为user的索引,索引配置为:3 primary shard,每个primary shard 2个replica 正常 ...

Mon Oct 01 06:43:00 CST 2018 0 1523
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM