原文:記錄一次Centos7宕機事件

事件背景 年 月 日 點 分,收到告警,大數據 節點宕機,發現此問題出現過 次,分別在生成大數據服務器的 個節點上發生。這次決心要查處問題。 服務是CDH節點,就是大數據那一套東西。 系統版本:CentOS Linux release . . 內核版本: . . .el .x 服務器廠商:Dell R 故障分析 服務器宕機主要有 條分析思路。 是否內存或者CPU爆滿,導致服務器OOM,導致服務器重 ...

2020-09-27 18:31 0 2462 推薦指數:

查看詳情

由Redis的hGetAll函數所引發的一次服務宕機事件

昨晚通宵生產壓測,終於算是將生產服務宕機的原因定位到了,心累。這篇博客,算作一個復盤和記錄吧。。。 先來看看Redis的緩存淘汰算法思維導圖: 說明:當實際占用的內存超過Redis配置的maxmemory時,Redis就會根據用戶選擇淘汰策略清除被選中的key。 業務場景 ...

Sat Dec 22 06:08:00 CST 2018 1 538
記錄一次服務器突然宕機的排查

服務器突然宕機,領導找了服務器供應商,然后供應商發來一張馬賽克畫質的圖片。說是我們做了什么操作,透過馬賽克,隱約能看到一些 以及一些,供應商說是因為升級操作導致的,但是上面分明是22號升級的,23號宕的機。 全圖(眼差點瞎了) 查看系統日志 所有日志目錄 查看 ...

Mon Nov 25 23:33:00 CST 2019 0 347
記錄一次Oracle很卡事件

臨近下班時間點,突然被同事告知數據庫很卡,連查詢都無法使用,登陸也是各種慢。 遠程登陸到服務器(遠程過程中也是費勁九牛二虎之力才上來),檢查了服務器的各種資源,發現除了磁盤IO其他的資源一切正常,初步懷疑是IO問題導致的。 話不多說本地通過sqlplus命令連接到數據庫,手動生成一次快照,命令 ...

Wed Sep 05 18:29:00 CST 2018 0 3066
一次修改數據庫物理文件造成Mysql宕機的恢復記錄

事件起始 某夜,我正在床上冥想准備入睡,忽然同事向我求救:消息內容如下: Oh My Gold 改了些配置,啥都沒了!都沒了!沒了!了! 我仔細詢問,原來是她因為某些原因將某庫的物理文件夾改名后,發現數據庫找不到了。於是又將名稱改回來。結果仍然找不到。這讓她覺得數據可能被損壞了,於是趕忙 ...

Thu Feb 20 04:22:00 CST 2020 3 752
一次Centos7主機自動重啟原因查詢

1 背景描述最近上線了一台物理機,IT那邊安裝的操作系統的版本信息如下:CentOS Linux release 7.3.1611 (Core) 該系統是跑docker的,docker版本為Docker version 19.03.6在運行的故障中,出現異常宕機重啟的情況 ...

Thu Apr 02 22:07:00 CST 2020 0 9729
Centos7一次War包的部署與運行

Centos7一次War包的部署與運行 前言 由於前段時間第一次部署一個小型的項目,時間一長所以有些步驟有時候時間一長就忘了,在此做個簡單的記錄 一、原始系統開發環境 操作系統:Windows10; 開發語言:前端:Html,CSS,JavaScript;后台:Java ...

Wed Nov 18 02:01:00 CST 2020 0 388
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM