Mysql作為一個常用數據庫,在互聯網系統應用很多。有些故障是其自身的bug,有些則不是,這里以前段時間遇到的問題舉例。 問題## 當時遇到的症狀是這樣的,我們的應用在線上測試環境,JMeter測試過程中,發現每次壓力測試開始時訪問低前幾個http request請求會超時,而之后的請求持續 ...
項目架構: 部分組件如下: SpringCloudAlibaba Nacos Gateway OpenFeign SpringBoot .x Redis 問題背景: 最近由於用戶量增大,在高峰時期,會導致用戶服務偶爾Redis出現連接超時的情況, 例如:從Redis中獲取手機驗證碼 ,登錄成功后,將token存入Redis,以及涉及到使用Redis的場景都會出現RedisConnectionFai ...
2021-03-03 00:32 0 1020 推薦指數:
Mysql作為一個常用數據庫,在互聯網系統應用很多。有些故障是其自身的bug,有些則不是,這里以前段時間遇到的問題舉例。 問題## 當時遇到的症狀是這樣的,我們的應用在線上測試環境,JMeter測試過程中,發現每次壓力測試開始時訪問低前幾個http request請求會超時,而之后的請求持續 ...
1、事件還原 昨天下午,收到一個504的告警,顯然這是一個超時告警。當時由於手頭有其他事情,沒在意,就只是瞄了一眼,但是引起告警的方法很熟悉,是我寫的,第一反應有點詫異。 詫異之后,繼續處理手頭的工作。 一小時過后,又收到同樣的告警,顯然不是偶爾,肯定是哪兒出問題了,於是開始排查。 報警 ...
線上問題的排查過程1、測試統一收口,2、產品判斷是否正常邏輯 | 測試判斷是否已經用例覆蓋 | 技術排查日志或代碼變更 ...
微信公眾號:內核小王子 覺得可以的話歡迎關注 場景:公司對外網關對很多外部商戶開放,運行多年一直正常,昨天某一個客戶調用我們接口的時候頻繁報connectiontimeout,異常如下: 該異常來自於httpclient,原因是創建連接超時,也就是tcp進行三次握手的時候失敗 ...
最近2周開始接手apache flink全鏈路監控數據的作業,包括指標統計,業務規則匹配等邏輯,計算結果實時寫入elasticsearch. 昨天遇到生產環境有作業無法正常重啟的問題,我負責對這個問題進行排查跟進。 第一步,基礎排查 首先拿到jobmanager和taskmanager的日志 ...
背景 前段時間收到運維反饋,線上Mysql數據庫凌晨時候出現慢查詢的報警,並把原始sql發了過來: 表數據量200W左右,不是很大,而且是根據主鍵更新。 問題排查 排查Mysql數據庫 我看到sql后第一反應就是是不是數據庫出問題了,每個小時都有業務,偏偏白天業務高峰時間段 ...
Linux(2)---記錄一次線上服務 CPU 100%的排查過程 當時產生CPU飆升接近100%的原因是因為項目中的websocket時時斷開又重連導致CPU飆升接近100% 。如何排查的呢 是通過日志輸出錯誤信息: 得知websocket時時重新 連接的信息,然后找到原因 解決 ...
問題背景 在業務使用redis過程中,出現了read timeout 的異常。 問題排查 直接原因 運維查詢redis慢查詢日志,發現在異常時間節點,有redis慢查詢日志,執行sadd 命令花費了1秒鍾。但由於redis是單線程應用,執行單條命令的阻塞,會造成其他命令的排隊等候,導致 ...