背景 近期被抓壯丁解決一個幾年前的系統故障,經過反復排查多次監控后終於成功解決,記錄分享一下心得吧! 故障描述 具體表現為在高峰訪問期間,IIS直接報服務器處理503。 系統部署 采用ARR實現的IIS Sever Farm進行負載均衡 ...
公司報表分析系統已經運行了一年多,最近收到服務器內存警告信息內存耗盡,第一時間着手排查問題,記錄下排查內存耗盡問題整個過程使用到的命令。 第一步查看內存使用情況: free m 命令:已M單位顯示服務器實際內存使用情況,如圖: 第 行mem數據:total內存總數: used已經使用的內存數: free空閑的內存數: shared當前已經廢棄不用buffers內存數: cached內存數: 第 行 ...
2018-02-01 23:29 0 2412 推薦指數:
背景 近期被抓壯丁解決一個幾年前的系統故障,經過反復排查多次監控后終於成功解決,記錄分享一下心得吧! 故障描述 具體表現為在高峰訪問期間,IIS直接報服務器處理503。 系統部署 采用ARR實現的IIS Sever Farm進行負載均衡 ...
都是在內存中處理的) 記錄下此次OOM的排查過程。 1. 前置知識 關於JVM調試的前置知 ...
與鎖相關的源碼,但是如果我們能夠掌握基本的死鎖排查方法,對我們的日常開發還是大有裨益的。PS:本文不會介 ...
近期需要對公司的接口做線上的巡查監控,需要寫一個腳本放到服務器上,定時運行腳本監測線上接口是否正常。測試的接口不是HTTP協議,而是公司基於TCP協議開發的私有協議,因此不能直接用現成的一些接口測試工具,需要自己寫代碼來調用接口。由於是私有協議,為了方便各業務項目進行通信,開發部門統一提供了一個 ...
微信公眾號:內核小王子 覺得可以的話歡迎關注 場景:公司對外網關對很多外部商戶開放,運行多年一直正常,昨天某一個客戶調用我們接口的時候頻繁報connectiontimeout,異常如下: 該異常來自於httpclient,原因是創建連接超時,也就是tcp進行三次握手的時候失敗 ...
地去分析與鎖相關的源碼,但是如果我們能夠掌握基本的死鎖排查方法,對我們的日常開發還是大有裨益的。 死鎖 ...
最近2周開始接手apache flink全鏈路監控數據的作業,包括指標統計,業務規則匹配等邏輯,計算結果實時寫入elasticsearch. 昨天遇到生產環境有作業無法正常重啟的問題,我負責對這個問題進行排查跟進。 第一步,基礎排查 首先拿到jobmanager和taskmanager的日志 ...
Linux(2)---記錄一次線上服務 CPU 100%的排查過程 當時產生CPU飆升接近100%的原因是因為項目中的websocket時時斷開又重連導致CPU飆升接近100% 。如何排查的呢 是通過日志輸出錯誤信息: 得知websocket時時重新 連接的信息,然后找到原因 解決 ...