可用。於是我們對服務器上的狀況進行了排查。 二.排查問題的過程 在這次的問題排查主要是圍繞JVM的內存使用情況,生 ...
問題發現 Prometheus報警某服務的一個節點 Old GC過多,需要排查。 查看GC日志 使用tail f gc.log命令查看異常節點的GC日志,從日志可以看出Young GC過於頻繁,竟然在 s內有 次Young GC: 使用tail f gc.log命令查看正常節點的GC日志,從日志可以看出,正常節點,很久才進行一次Young GC: 兩個節點的JVM參數配置是完全一樣的,並且負載均 ...
2019-07-02 23:10 2 360 推薦指數:
可用。於是我們對服務器上的狀況進行了排查。 二.排查問題的過程 在這次的問題排查主要是圍繞JVM的內存使用情況,生 ...
前言 之前或多或少分享過一些內存模型、對象創建之類的內容,其實大部分人看完都是懵懵懂懂,也不知道這些的實際意義。 直到有一天你會碰到線上奇奇怪怪的問題,如: 線程執行一個任務遲遲沒有返回,應用假死。 接口響應緩慢,甚至請求超時。 CPU 高負載運行。 這類問題並不 ...
轉貼:http://my.oschina.net/flashsword/blog/205266 本文是一次線上OOM故障排查的經過,內容比較基礎但是真實,主要是記錄一下,沒有OOM排查經驗的同學也可以參考。 現象 我們之前有一個計算作業。最近經常出現不穩定,無法正常響應的情況。具體表現 ...
前言 如果在Lua語言中某一處死循環了!你特么的怎么去查出這特么的該死的循環到底在特么的哪里!!! 重現步驟 一打開技能界面,整個游戲就卡死不動了 開始排查 查看一下cpu占用率,unity占用60%+,應該是死循環 一開始采取冒煙式查錯法,去一些可疑的地方一個個打斷 ...
1、事件還原 昨天下午,收到一個504的告警,顯然這是一個超時告警。當時由於手頭有其他事情,沒在意,就只是瞄了一眼,但是引起告警的方法很熟悉,是我寫的,第一反應有點詫異。 詫異之后,繼續處理手頭的工作。 一小時過后,又收到同樣的告警,顯然不是偶爾,肯定是哪兒出問題了,於是開始排查。 報警 ...
今天早上,收到一個報警,有個服務器的http往返時延飆升,同時曝出大量404,很是折騰了一番,特記錄下思考和排查經過。 1.這是單純的時延增大,還是有什么其他情況還未掌握? 因為不知道是只有時延變大而已,還是同時有別的情況,第一反應是先看日志有沒有異常。 看了一下,一片風平浪靜,既是好消息 ...
我們的情況和這個朋友遇到的有點類似: https://blog.csdn.net/majianting/article/details/96476375 如我的域名是:yuming.api.com 如公網ip是:192.168.2.202 我線上的接口是:http://yuming.api.com ...
之前同事反饋說線上遇到Redis反序列化異常問題,異常如下: 已知信息如下: 該異常不是必現的,偶爾才會出現; 出現該異常后重啟應用或者過一會就好了; 序列化協議使用了hessian。 因為偶爾出現,首先看了報異常那塊業務邏輯是不是有問題,看了一遍也發現 ...