項目開了個P2P服務器,但是運行一段時間就會出現丟包問題,具體表現為:1、udp丟包嚴重(一分鍾收發分別1.5W) 2、ssh(用於運維指令)連接不上該服務器(超時) 3、服務器運行好像沒什么異常,udp假連接數比tcp連接數少(正常應該相近) 首先開始懷疑是不是客戶端 ...
目錄 概述 故障回溯 補充說明 其他工具 概述 最近遇到線上故障,具體的情況就是后端服務請求一直 pending,服務經常假死重啟。 但是觀察 整個進程CPU 內存消耗不是特別大, 沒有明顯的資源泄漏情況。 故障回溯 top p 查看進程情況,發現沒有明顯的 內存和 CPU使用率過高 top Hp 查看進程下的所有線程,沒有明顯的線程 CPU 內存使用率過高 備注若遇到 某個線程 資源消耗非常高 ...
2021-12-09 20:05 0 1159 推薦指數:
項目開了個P2P服務器,但是運行一段時間就會出現丟包問題,具體表現為:1、udp丟包嚴重(一分鍾收發分別1.5W) 2、ssh(用於運維指令)連接不上該服務器(超時) 3、服務器運行好像沒什么異常,udp假連接數比tcp連接數少(正常應該相近) 首先開始懷疑是不是客戶端 ...
使用Tomcat作為Web服務器的時候偶爾會遇到Tomcat停止響應的情況,通過netstat查看端口情況會發現tomcat的端口出現大量的CLOSE_WAIT,此時Tomcat會停止響應前端請求,同時服務端的日志,操作等將全部停止,而且沒有出現任何異常,此時就需要排查是哪方面的原因,此案 ...
今天我在連接公司的服務器時候,發現ssh連接不了,以下就是我在自己虛擬機上面ssh遠程連接不了服務器的排查故障整理 服務器ssh連接不上的原因有以下幾種: 1,網絡原因,我們可以先ping一下服務氣的IP是否能ping通,能平通就可以排除網絡原因 不能ping通,可以看一下network ...
事故經過 排查 總結 事故經過 【2019-12-27 18:00 周五】 業務方突然找來說調用我們程序大量提示“觸發限流”,但是我們沒有收到任何監控報警。緊急查看了下 ServiceMesh sidecar 代理監控發現流量持續在減少,但是監控中沒有任何觸發限流的 http ...
剛入職公司接觸到的第一個項目,應用架構比較簡單和無理 1、業務是推送數據到ldap數據庫,應用是java寫的 2、架構是兩台mysql主主復制,haproxy做兩台mysql的負載(ps:由於應用代碼的邏輯,導致haproxy只能把流量切換到一台數據庫),keepalived做高可用 ...
記一次線上服務器redis 經常掉線的問題 環境: windows service 2019, redis, java8, 由於服務器資源有限, 項目的數據庫oracle, 緩存數據庫redis和web服務tomcat都在同一個台服務器部署 問題描述: 在使用會經常報錯 redis pool無可 ...
該筆記主要記錄一下如何排查指定服務器中的指定內存條是否損壞。 1.內存故障排查 因為 68 – 71 軟SBC服務器都是Centos7系統,所以我們可以通過以下命令來排查內存是否出現損壞。 grep "[0-9]" /sys/devices/system/edac/mc/mc/csrow ...
一、top(Linux命令) 執行top命令: (查看進程15477的詳細情況,下文用到) 系統信息(前五行): 第1行:Top 任務隊列信息(系統運行狀態及平均負載) ...