原文:記錄一次Flink作業異常的排查過程

最近 周開始接手apache flink全鏈路監控數據的作業,包括指標統計,業務規則匹配等邏輯,計算結果實時寫入elasticsearch. 昨天遇到生產環境有作業無法正常重啟的問題,我負責對這個問題進行排查跟進。 第一步,基礎排查 首先拿到jobmanager和taskmanager的日志,我從taskmanager日志中很快發現 個基礎類型的報錯,一個是npe,一個是索引找不到的異常 elas ...

2020-06-17 16:07 0 571 推薦指數:

查看詳情

記錄一次Mysql死鎖排查過程

與鎖相關的源碼,但是如果我們能夠掌握基本的死鎖排查方法,對我們的日常開發還是大有裨益的。PS:本文不會介 ...

Mon Feb 20 22:30:00 CST 2017 0 3701
記錄一次http網絡超時的排查過程

微信公眾號:內核小王子 覺得可以的話歡迎關注 場景:公司對外網關對很多外部商戶開放,運行多年一直正常,昨天某一個客戶調用我們接口的時候頻繁報connectiontimeout,異常如下: 該異常來自於httpclient,原因是創建連接超時,也就是tcp進行三握手的時候失敗 ...

Tue May 21 22:50:00 CST 2019 0 829
記錄一次Mysql死鎖排查過程

地去分析與鎖相關的源碼,但是如果我們能夠掌握基本的死鎖排查方法,對我們的日常開發還是大有裨益的。 死鎖 ...

Fri May 17 23:02:00 CST 2019 0 2716
一次故障排查過程

上周晚上,某環境 ES 出現阻塞, 運行緩慢。於是開始排查問題的過程。 開始 思路:現象是阻塞,通常是 CPU 彪高,導致業務線程分配不到 CPU 時間片,或者內存吃緊,頻繁 GC 導致的 STW。 登錄到目標服務器,由於 ES 的用戶不是 LZ,因此找運維要了 root 權限,登錄到服務器 ...

Fri Jan 25 20:50:00 CST 2019 2 969
一次奇怪的的bug排查過程

公司對底層基礎庫進行了重構,線上穩定跑了幾天,在查看訂單系統的log時,有幾條error信息非常的奇怪, 訂單有狀態機進行維護 已經被撤消的訂單不能再進行有其他操作,和狀態更改。 已 ...

Tue Nov 30 18:00:00 CST 2021 2 1723
原創 記錄一次線上Mysql慢查詢問題排查過程

背景 前段時間收到運維反饋,線上Mysql數據庫凌晨時候出現慢查詢的報警,並把原始sql發了過來: 表數據量200W左右,不是很大,而且是根據主鍵更新。 問題排查 排查Mysql數據庫 我看到sql后第一反應就是是不是數據庫出問題了,每個小時都有業務,偏偏白天業務高峰時間段 ...

Fri Mar 27 21:00:00 CST 2020 0 964
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM