昨晚通宵生產壓測,終於算是將生產服務宕機的原因定位到了,心累。這篇博客,算作一個復盤和記錄吧。。。 先來看看Redis的緩存淘汰算法思維導圖: 說明:當實際占用的內存超過Redis配置的maxmemory時,Redis就會根據用戶選擇淘汰策略清除被選中的key。 業務場景 ...
事件背景 年 月 日 點 分,收到告警,大數據 節點宕機,發現此問題出現過 次,分別在生成大數據服務器的 個節點上發生。這次決心要查處問題。 服務是CDH節點,就是大數據那一套東西。 系統版本:CentOS Linux release . . 內核版本: . . .el .x 服務器廠商:Dell R 故障分析 服務器宕機主要有 條分析思路。 是否內存或者CPU爆滿,導致服務器OOM,導致服務器重 ...
2020-09-27 18:31 0 2462 推薦指數:
昨晚通宵生產壓測,終於算是將生產服務宕機的原因定位到了,心累。這篇博客,算作一個復盤和記錄吧。。。 先來看看Redis的緩存淘汰算法思維導圖: 說明:當實際占用的內存超過Redis配置的maxmemory時,Redis就會根據用戶選擇淘汰策略清除被選中的key。 業務場景 ...
服務器突然宕機,領導找了服務器供應商,然后供應商發來一張馬賽克畫質的圖片。說是我們做了什么操作,透過馬賽克,隱約能看到一些 以及一些,供應商說是因為升級操作導致的,但是上面分明是22號升級的,23號宕的機。 全圖(眼差點瞎了) 查看系統日志 所有日志目錄 查看 ...
臨近下班時間點,突然被同事告知數據庫很卡,連查詢都無法使用,登陸也是各種慢。 遠程登陸到服務器(遠程過程中也是費勁九牛二虎之力才上來),檢查了服務器的各種資源,發現除了磁盤IO其他的資源一切正常,初步懷疑是IO問題導致的。 話不多說本地通過sqlplus命令連接到數據庫,手動生成一次快照,命令 ...
電腦死機 , 強制關機重啟后 , 虛擬機就掛掉了 . 顯示 : Entering emergency mode reboot無法解決 . 網上找了半天終於找到解決方法: 首先 , 使 ...
事件起始 某夜,我正在床上冥想准備入睡,忽然同事向我求救:消息內容如下: Oh My Gold 改了些配置,啥都沒了!都沒了!沒了!了! 我仔細詢問,原來是她因為某些原因將某庫的物理文件夾改名后,發現數據庫找不到了。於是又將名稱改回來。結果仍然找不到。這讓她覺得數據可能被損壞了,於是趕忙 ...
p:first-child, #write > ul:first-child, #write > ol:first-child, #write > pre:first-child, #writ ...
1 背景描述最近上線了一台物理機,IT那邊安裝的操作系統的版本信息如下:CentOS Linux release 7.3.1611 (Core) 該系統是跑docker的,docker版本為Docker version 19.03.6在運行的故障中,出現異常宕機重啟的情況 ...
Centos7上一次War包的部署與運行 前言 由於前段時間第一次部署一個小型的項目,時間一長所以有些步驟有時候時間一長就忘了,在此做個簡單的記錄 一、原始系統開發環境 操作系統:Windows10; 開發語言:前端:Html,CSS,JavaScript;后台:Java ...