背景说明 某天生产环境发生进程的活跃线程数过高的预警问题,且一天两个节点分别出现相同预警。此程序近一年没出现过此类预警,事出必有因,本文就记录下此次根因分析的过程。 监控看到的线程数变化情况: 初步的分析和发现 异常的进程在重启时分别保留了dump,这是进行下一步windbg分析的前提 ...
前言: 这篇随笔是最近处理的一起真实网络故障分析案例,特此分享给身边同行的朋友。 故障介绍: 公网这台服务器通过http协议与分支内部的一台服务器做业务交易,当公网服务器向分支这台内部服务器发起http请求做交易时,结果无响应,这也意味着是一次失败的业务交易。多次尝试,结果依然是无响应,由此展开了故障排查工作。排查的过程中客户回忆到是在某一个时刻打完网站补丁后,出的交易故障,客户建议卸载补丁试试看 ...
2020-12-23 20:06 0 335 推荐指数:
背景说明 某天生产环境发生进程的活跃线程数过高的预警问题,且一天两个节点分别出现相同预警。此程序近一年没出现过此类预警,事出必有因,本文就记录下此次根因分析的过程。 监控看到的线程数变化情况: 初步的分析和发现 异常的进程在重启时分别保留了dump,这是进行下一步windbg分析的前提 ...
网络丢包是我们在使用ping对目站进行询问时,数据包由于各种原因在信道中丢失的现象。ping使用了ICMP回送请求与回送回答报文。ICMP回送请求报文是主机或路由器向一个特定的目的主机发出的询问,收到此报文的机器必须给源主机发送ICMP回送回答报文。这种询问报文用来测试目的站是否可到达以及了解 ...
1.Client节点 client代表由最终用户操作的实体,它必须连接到某一个peer节点或者orderer节点上与区块链网络通信。客户端向endorser提交交易提案,当收集到足够背书后,向排序服务广播交易,进行排序,生成区块。但是该节点的故障不会影响区块链网络的正常运行。 2.CA节点 ...
1、问题的如何发生的 1.1、应用功能介绍 系统是一个双数据源双写单独的服务。(两个数据源是不同的存储,所以无法使用主从复制的模式,是一个切换存储介质的过渡态)。 历史代码有个更新逻辑u ...
[文章]Linux宕机故障分析案例 已采纳 收藏 0 1669 0 马化辉 2018-07-01发布 背景 在Linux系统环境下,服务器宕机发生的频率比较小,但是不少工程师或多或少都会遇到这种情况 ...
1. 确认是否有人刚发过代码。根据故障时间线&代码发布时间线,如果能找到精确对应关系,基本上可以 ...
目录 背景 问题分析 官方解析 日志分析 节点2日志分析 节点2 ora-27037异常原因 节点1日志分析 节点1定时任务 问题时间列表 总结 ...
Linux宕机故障分析案例马化辉 背景 在Linux系统环境下,服务器宕机发生的频率比较小,但是不少工程师或多或少都会遇到这种情况,有时候会手足无措,不知从何入手。笔者将借助一次案例分析,展示下Linux宕机故障事件的处理方法和思路。 宕机发生的原因不一,或者是硬件原因,或者是性能原因 ...