原文:记录一次Centos7宕机事件

事件背景 年 月 日 点 分,收到告警,大数据 节点宕机,发现此问题出现过 次,分别在生成大数据服务器的 个节点上发生。这次决心要查处问题。 服务是CDH节点,就是大数据那一套东西。 系统版本:CentOS Linux release . . 内核版本: . . .el .x 服务器厂商:Dell R 故障分析 服务器宕机主要有 条分析思路。 是否内存或者CPU爆满,导致服务器OOM,导致服务器重 ...

2020-09-27 18:31 0 2462 推荐指数:

查看详情

由Redis的hGetAll函数所引发的一次服务宕机事件

昨晚通宵生产压测,终于算是将生产服务宕机的原因定位到了,心累。这篇博客,算作一个复盘和记录吧。。。 先来看看Redis的缓存淘汰算法思维导图: 说明:当实际占用的内存超过Redis配置的maxmemory时,Redis就会根据用户选择淘汰策略清除被选中的key。 业务场景 ...

Sat Dec 22 06:08:00 CST 2018 1 538
记录一次服务器突然宕机的排查

服务器突然宕机,领导找了服务器供应商,然后供应商发来一张马赛克画质的图片。说是我们做了什么操作,透过马赛克,隐约能看到一些 以及一些,供应商说是因为升级操作导致的,但是上面分明是22号升级的,23号宕的机。 全图(眼差点瞎了) 查看系统日志 所有日志目录 查看 ...

Mon Nov 25 23:33:00 CST 2019 0 347
记录一次Oracle很卡事件

临近下班时间点,突然被同事告知数据库很卡,连查询都无法使用,登陆也是各种慢。 远程登陆到服务器(远程过程中也是费劲九牛二虎之力才上来),检查了服务器的各种资源,发现除了磁盘IO其他的资源一切正常,初步怀疑是IO问题导致的。 话不多说本地通过sqlplus命令连接到数据库,手动生成一次快照,命令 ...

Wed Sep 05 18:29:00 CST 2018 0 3066
一次修改数据库物理文件造成Mysql宕机的恢复记录

事件起始 某夜,我正在床上冥想准备入睡,忽然同事向我求救:消息内容如下: Oh My Gold 改了些配置,啥都没了!都没了!没了!了! 我仔细询问,原来是她因为某些原因将某库的物理文件夹改名后,发现数据库找不到了。于是又将名称改回来。结果仍然找不到。这让她觉得数据可能被损坏了,于是赶忙 ...

Thu Feb 20 04:22:00 CST 2020 3 752
一次Centos7主机自动重启原因查询

1 背景描述最近上线了一台物理机,IT那边安装的操作系统的版本信息如下:CentOS Linux release 7.3.1611 (Core) 该系统是跑docker的,docker版本为Docker version 19.03.6在运行的故障中,出现异常宕机重启的情况 ...

Thu Apr 02 22:07:00 CST 2020 0 9729
Centos7一次War包的部署与运行

Centos7一次War包的部署与运行 前言 由于前段时间第一次部署一个小型的项目,时间一长所以有些步骤有时候时间一长就忘了,在此做个简单的记录 一、原始系统开发环境 操作系统:Windows10; 开发语言:前端:Html,CSS,JavaScript;后台:Java ...

Wed Nov 18 02:01:00 CST 2020 0 388
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM