原文:一次線上tomcat應用請求阻塞的排查經過

今天早上,收到一個報警,有個服務器的http往返時延飆升,同時曝出大量 ,很是折騰了一番,特記錄下思考和排查經過。 .這是單純的時延增大,還是有什么其他情況還未掌握 因為不知道是只有時延變大而已,還是同時有別的情況,第一反應是先看日志有沒有異常。 看了一下,一片風平浪靜,既是好消息也是壞消息。好消息是核心業務還在,不然一定會打日志,壞消息是日志提供不了任何信息。當然這也說明了我們的日志肯定有不到位 ...

2018-01-30 19:40 0 3962 推薦指數:

查看詳情

一次線上OOM過程的排查

可用。於是我們對服務器上的狀況進行了排查。 二.排查問題的過程 在這次的問題排查主要是圍繞JVM的內存使用情況,生 ...

Thu Nov 08 22:34:00 CST 2018 0 1460
一次線上死循環的排查

1、問題發現 Prometheus報警某服務的一個節點 Old GC過多,需要排查。 2、查看GC日志 使用tail -f gc.log命令查看異常節點的GC日志,從日志可以看出Young GC過於頻繁,竟然在1s內有9Young GC: 使用tail ...

Wed Jul 03 07:10:00 CST 2019 2 360
一次線上問題排查所引發的思考

前言 之前或多或少分享過一些內存模型、對象創建之類的內容,其實大部分人看完都是懵懵懂懂,也不知道這些的實際意義。 直到有一天你會碰到線上奇奇怪怪的問題,如: 線程執行一個任務遲遲沒有返回,應用假死。 接口響應緩慢,甚至請求超時。 CPU 高負載運行。 這類問題並不 ...

Mon Jul 09 16:20:00 CST 2018 6 3053
一次線上OOM故障排查經過

轉貼:http://my.oschina.net/flashsword/blog/205266 本文是一次線上OOM故障排查的經過,內容比較基礎但是真實,主要是記錄一下,沒有OOM排查經驗的同學也可以參考。 現象 我們之前有一個計算作業。最近經常出現不穩定,無法正常響應的情況。具體表現 ...

Thu Mar 06 21:05:00 CST 2014 0 2844
一次線上SpringCloud-Feign請求服務超時異常排查

由於近期線上單量暴漲,第三方反饋部分工單業務存在查詢處理失敗現象,經排查是當前系統通過FeignClient調用下游系統出現部分超時失敗(異常代碼貼在下方)。 通過系統慢請求捕捉攔截,發現當前請求僅耗時1031毫秒,就觸發Read timed out超時錯誤,本項 ...

Thu Jan 13 22:22:00 CST 2022 0 992
解Bug之路-記一次線上請求偶爾變慢的排查

解Bug之路-記一次線上請求偶爾變慢的排查 前言 最近解決了個比較棘手的問題,由於排查過程挺有意思,於是就以此為素材寫出了本篇文章。 Bug現場 這是一個偶發的性能問題。在每天幾百萬比交易請求中,平均耗時大約為300ms,但總有那么100多筆會超過1s,讓我們業務耗時監控的99.99線變得 ...

Mon Oct 12 18:40:00 CST 2020 29 2988
一次線上接口超時的排查過程

1、事件還原 昨天下午,收到一個504的告警,顯然這是一個超時告警。當時由於手頭有其他事情,沒在意,就只是瞄了一眼,但是引起告警的方法很熟悉,是我寫的,第一反應有點詫異。 詫異之后,繼續處理手頭的工作。 一小時過后,又收到同樣的告警,顯然不是偶爾,肯定是哪兒出問題了,於是開始排查。 報警 ...

Sun Sep 29 08:17:00 CST 2019 2 1588
記錄一次tcp_timestamps 線上問題的排查

我們的情況和這個朋友遇到的有點類似: https://blog.csdn.net/majianting/article/details/96476375 如我的域名是:yuming.api.com 如公網ip是:192.168.2.202 我線上的接口是:http://yuming.api.com ...

Thu Apr 14 17:22:00 CST 2022 0 758
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM