原文:【linux杂谈】跟随大牛进行一次服务器间通讯问题的排查

发现应用记录日志内,出现网络访问延迟较大的情况。 此类问题较为常见,特别是之前参与辅助一个朋友项目运维的过程中,经常因为网络访问延迟较大,朋友认为是遭到了ddos攻击或者是cc攻击。网络访问延迟较大常常会给顶层业务带来损失,甚至严重影响用户体验。 遇到这类问题,首先根据OSI七层模型,从上到下,尽可能脱离更加高层的协议带来的影响。一般说来,稍微有经验的人都会采用ping的方式,通过探寻icmp是否 ...

2019-06-28 22:24 0 505 推荐指数:

查看详情

一次服务器CPU占用100%的问题排查

今天写了一段垃圾代码,然后上服务器上运行,cpu瞬间飙到了100%,现记录一下问题排除过程~ 1. 问题代码 2. top 3. 查找问题 3.1 top -Hp 18571, 找出最耗cpu的线程,结果发现18584是就耗了99.9 ...

Wed Oct 23 06:17:00 CST 2019 0 829
记录一次服务器突然宕机的排查

服务器突然宕机,领导找了服务器供应商,然后供应商发来一张马赛克画质的图片。说是我们做了什么操作,透过马赛克,隐约能看到一些 以及一些,供应商说是因为升级操作导致的,但是上面分明是22号升级的,23号宕的机。 全图(眼差点瞎了) 查看系统日志 所有日志目录 查看 ...

Mon Nov 25 23:33:00 CST 2019 0 347
一次服务器高CPU的排查思路

现象 排查思路 另一台服务器CPU正常,由于消息中心有部分老接口是域名调用的,网关已做负载均衡,并且pinpoint上的两台服务器gc如图,初步猜测是否是负载不均衡导致。 经运维调试nginx权重无效,证明与负载均衡无关。那么先看子线程,这种情况 ...

Wed Sep 25 22:46:00 CST 2019 0 673
服务器一次对Close_Wait 状态故障的排查经历

最近接连听说一台线上服务器总是不响应客户端请求。 登录服务器后查询iis状态,发现应用程序池状态变为已停止。 按经验想,重启后应该就ok,第一次遇到也确实起了作用,当时完全没在意,以为是其他人无意把服务关闭了而已。 但是之后几天几乎每天都出现问题,应用程序池再次成为 已停止 状态。这个情况 ...

Fri Dec 08 02:36:00 CST 2017 0 15779
linux服务器问题排查:w命令卡住

基本情况 系统: ubuntu16.04 症状: who命令可以用,w命令用不了 sudo iotop命令会卡住,黑屏 nvidia-smi命令和nvl命令都用不了,卡住 排查步骤 可以看到,是编号为42943的进程出问题了,卡在I/O上了。 第一想法尝试kill它,发现 ...

Fri Aug 16 18:54:00 CST 2019 0 388
记录一次服务器内存耗尽排查过程使用到的命令

公司报表分析系统已经运行了一年多,最近收到服务器内存警告信息内存耗尽,第一时间着手排查问题,记录下排查内存耗尽问题整个过程使用到的命令。 第一步查看内存使用情况: free -m 命令:已M单位显示服务器实际内存使用情况,如图: 第1行mem数据:total内存总数 ...

Fri Feb 02 07:29:00 CST 2018 0 2412
一次resin服务器故障排查,以及jstack初步了解

  不知道为什么,窗外出现了乌云,又不知道为什么,烦人的蝉鸣突然变得无声了,大脑中的嘈杂瞬间归位了宁静,草他么,我的测试服务器又特么无缘无故的崩了。   作为菜鸟为了排查故障,最先想到的就是找日志,先后分析了项目启动日志,resin启动日志,jvm日志完全看不出来结果。     1.jvm日志 ...

Thu Aug 20 04:54:00 CST 2015 0 2048
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM