项目开了个P2P服务器,但是运行一段时间就会出现丢包问题,具体表现为:1、udp丢包严重(一分钟收发分别1.5W) 2、ssh(用于运维指令)连接不上该服务器(超时) 3、服务器运行好像没什么异常,udp假连接数比tcp连接数少(正常应该相近) 首先开始怀疑是不是客户端 ...
目录 概述 故障回溯 补充说明 其他工具 概述 最近遇到线上故障,具体的情况就是后端服务请求一直 pending,服务经常假死重启。 但是观察 整个进程CPU 内存消耗不是特别大, 没有明显的资源泄漏情况。 故障回溯 top p 查看进程情况,发现没有明显的 内存和 CPU使用率过高 top Hp 查看进程下的所有线程,没有明显的线程 CPU 内存使用率过高 备注若遇到 某个线程 资源消耗非常高 ...
2021-12-09 20:05 0 1159 推荐指数:
项目开了个P2P服务器,但是运行一段时间就会出现丢包问题,具体表现为:1、udp丢包严重(一分钟收发分别1.5W) 2、ssh(用于运维指令)连接不上该服务器(超时) 3、服务器运行好像没什么异常,udp假连接数比tcp连接数少(正常应该相近) 首先开始怀疑是不是客户端 ...
使用Tomcat作为Web服务器的时候偶尔会遇到Tomcat停止响应的情况,通过netstat查看端口情况会发现tomcat的端口出现大量的CLOSE_WAIT,此时Tomcat会停止响应前端请求,同时服务端的日志,操作等将全部停止,而且没有出现任何异常,此时就需要排查是哪方面的原因,此案 ...
今天我在连接公司的服务器时候,发现ssh连接不了,以下就是我在自己虚拟机上面ssh远程连接不了服务器的排查故障整理 服务器ssh连接不上的原因有以下几种: 1,网络原因,我们可以先ping一下服务气的IP是否能ping通,能平通就可以排除网络原因 不能ping通,可以看一下network ...
事故经过 排查 总结 事故经过 【2019-12-27 18:00 周五】 业务方突然找来说调用我们程序大量提示“触发限流”,但是我们没有收到任何监控报警。紧急查看了下 ServiceMesh sidecar 代理监控发现流量持续在减少,但是监控中没有任何触发限流的 http ...
刚入职公司接触到的第一个项目,应用架构比较简单和无理 1、业务是推送数据到ldap数据库,应用是java写的 2、架构是两台mysql主主复制,haproxy做两台mysql的负载(ps:由于应用代码的逻辑,导致haproxy只能把流量切换到一台数据库),keepalived做高可用 ...
记一次线上服务器redis 经常掉线的问题 环境: windows service 2019, redis, java8, 由于服务器资源有限, 项目的数据库oracle, 缓存数据库redis和web服务tomcat都在同一个台服务器部署 问题描述: 在使用会经常报错 redis pool无可 ...
该笔记主要记录一下如何排查指定服务器中的指定内存条是否损坏。 1.内存故障排查 因为 68 – 71 软SBC服务器都是Centos7系统,所以我们可以通过以下命令来排查内存是否出现损坏。 grep "[0-9]" /sys/devices/system/edac/mc/mc/csrow ...
一、top(Linux命令) 执行top命令: (查看进程15477的详细情况,下文用到) 系统信息(前五行): 第1行:Top 任务队列信息(系统运行状态及平均负载) ...