問題描述 公司項目測試環境調用某些接口的時候,服務器立即崩潰,並一定時間內無法提供服務。 問題排查 服務器配置不夠 第一反應是服務器需要升配啦,花錢解決一切!畢竟測試服務器配置確實不高,2CPU + 4Gib,能干啥?不過問題是今天突然發生的,而且說崩就崩。憑着嚴謹的態度,還是要刨根問底 ...
早上突然有小伙伴說系統無法訪問, 以下記錄下解決過程: 測試了一個接口結果如下 接口沒有響應 先看下應用日志 日志使用tail f 不會自己追加,用htop看到系統兩個核都 ,看到是應用占用的 接下了分析下Java程序怎么占用的 先來個總的: 服務器CPU使用率一直很高,達到 定位方法方法一: 轉載:http: www.linuxhot.com java cpu used high.html .j ...
2020-04-17 12:53 0 1107 推薦指數:
問題描述 公司項目測試環境調用某些接口的時候,服務器立即崩潰,並一定時間內無法提供服務。 問題排查 服務器配置不夠 第一反應是服務器需要升配啦,花錢解決一切!畢竟測試服務器配置確實不高,2CPU + 4Gib,能干啥?不過問題是今天突然發生的,而且說崩就崩。憑着嚴謹的態度,還是要刨根問底 ...
機房偶然的一次斷電中,恢復服務器后出現了 無法讀寫磁盤。 其他掛載的磁盤均無異常 查詢日志得知 磁盤掛了。。。 我單純的以為 可能是系統I/O異常 就reboot 重啟了。 發現無法進入系統, 又報 BIOS 異常,又報無法找到啟動盤 我暈了。 調整思路 ...
事故經過:網站突然無法正常使用,php子進程驟高,詢問開發無改動代碼,查看cpu,內存均無異常,最后查看磁盤使用率100%,然后通過top查看是php進程導致,就一直在查找代碼問題,均無收獲,最后實在沒轍了,老大說刪除下日志試試吧,刪完后網站恢復正常。突然想到一個東西inode,當時由於沒有常看 ...
早上zabbix報警,磁盤滿了,登錄服務器查看信息,一頓操作,突然發現最后lvextend命令不能擴容,查看LVM信息 報錯信息“Couldn't find device with uuid muM70o-3Zzu-FPEJ-YuwB-IXX6-0ezR-lgUK5f” 如圖所示,這個掛載 ...
告警 正在開會,突然釘釘告警聲響個不停,同時市場人員反饋客戶在投訴系統登不進了,報504錯誤。查看釘釘上的告警信息,幾台業務服務器節點全部報CPU超過告警閾值,達100%。 趕緊從會上下來,SSH登錄服務器,使用 top 命令查看,幾個Java進程CPU占用達到180%,190%,這幾 ...
報錯信息如下: Salt request timed out. The master is not responding. You may need to run your command wi ...
輸入命令 du -sh /* | sort -nr 會列出根目錄文件夾的大小 看到哪個文件夾比較大 刪除相應的緩存,重啟服務器即可 ...
生產中一塊磁盤故障,由於沒有在系統中先通過--removemissing 操作,直接熱插拔,做了raid 系統無法重啟,進入救援模式,注釋掉受影響的磁盤掛載點,重啟進入系統之后,做了如下操作 # parted /dev/sdd mklabel gpt 首先是將新盤設置成gpt格式 ...