问题描述 公司项目测试环境调用某些接口的时候,服务器立即崩溃,并一定时间内无法提供服务。 问题排查 服务器配置不够 第一反应是服务器需要升配啦,花钱解决一切!毕竟测试服务器配置确实不高,2CPU + 4Gib,能干啥?不过问题是今天突然发生的,而且说崩就崩。凭着严谨的态度,还是要刨根问底 ...
早上突然有小伙伴说系统无法访问, 以下记录下解决过程: 测试了一个接口结果如下 接口没有响应 先看下应用日志 日志使用tail f 不会自己追加,用htop看到系统两个核都 ,看到是应用占用的 接下了分析下Java程序怎么占用的 先来个总的: 服务器CPU使用率一直很高,达到 定位方法方法一: 转载:http: www.linuxhot.com java cpu used high.html .j ...
2020-04-17 12:53 0 1107 推荐指数:
问题描述 公司项目测试环境调用某些接口的时候,服务器立即崩溃,并一定时间内无法提供服务。 问题排查 服务器配置不够 第一反应是服务器需要升配啦,花钱解决一切!毕竟测试服务器配置确实不高,2CPU + 4Gib,能干啥?不过问题是今天突然发生的,而且说崩就崩。凭着严谨的态度,还是要刨根问底 ...
机房偶然的一次断电中,恢复服务器后出现了 无法读写磁盘。 其他挂载的磁盘均无异常 查询日志得知 磁盘挂了。。。 我单纯的以为 可能是系统I/O异常 就reboot 重启了。 发现无法进入系统, 又报 BIOS 异常,又报无法找到启动盘 我晕了。 调整思路 ...
事故经过:网站突然无法正常使用,php子进程骤高,询问开发无改动代码,查看cpu,内存均无异常,最后查看磁盘使用率100%,然后通过top查看是php进程导致,就一直在查找代码问题,均无收获,最后实在没辙了,老大说删除下日志试试吧,删完后网站恢复正常。突然想到一个东西inode,当时由于没有常看 ...
早上zabbix报警,磁盘满了,登录服务器查看信息,一顿操作,突然发现最后lvextend命令不能扩容,查看LVM信息 报错信息“Couldn't find device with uuid muM70o-3Zzu-FPEJ-YuwB-IXX6-0ezR-lgUK5f” 如图所示,这个挂载 ...
告警 正在开会,突然钉钉告警声响个不停,同时市场人员反馈客户在投诉系统登不进了,报504错误。查看钉钉上的告警信息,几台业务服务器节点全部报CPU超过告警阈值,达100%。 赶紧从会上下来,SSH登录服务器,使用 top 命令查看,几个Java进程CPU占用达到180%,190%,这几 ...
报错信息如下: Salt request timed out. The master is not responding. You may need to run your command wi ...
输入命令 du -sh /* | sort -nr 会列出根目录文件夹的大小 看到哪个文件夹比较大 删除相应的缓存,重启服务器即可 ...
生产中一块磁盘故障,由于没有在系统中先通过--removemissing 操作,直接热插拔,做了raid 系统无法重启,进入救援模式,注释掉受影响的磁盘挂载点,重启进入系统之后,做了如下操作 # parted /dev/sdd mklabel gpt 首先是将新盘设置成gpt格式 ...