一、背景 開發排查系統問題用得最多的手段就是查看系統日志,在分布式環境中一般使用ELK來統一收集日志,但是在並發大時使用日志定位問題還是比較麻煩,由於大量的其他用戶/其他線程的日志也一起輸出穿行其中導致很難篩選出指定請求的全部相關日志,以及下游線程/服務對應的日志。 二、解決思路 ...
在工作中,相信大家最怕的一件事就是聽到有人在工作群艾特你:某某功能報錯啦。。。 然后你就得屁顛屁顛的去服務器看日志,日志量少還好點,多的話找起來太麻煩了。不太容易直接定位到關鍵地方。 東找找西找找,好不容易找到了報錯的信息,卻不知道當時的參數信息是什么,也不太好復現,太難了。。 改完還得寫故障報告,美好的一天又沒了。 要解決這類的痛點需要做下面幾件事情: 日志收集 異常告警 日志增加鏈路 API響 ...
2021-01-18 12:52 4 914 推薦指數:
一、背景 開發排查系統問題用得最多的手段就是查看系統日志,在分布式環境中一般使用ELK來統一收集日志,但是在並發大時使用日志定位問題還是比較麻煩,由於大量的其他用戶/其他線程的日志也一起輸出穿行其中導致很難篩選出指定請求的全部相關日志,以及下游線程/服務對應的日志。 二、解決思路 ...
作為程序員對 GitHub 應該都不會陌生,我經常沉迷其中,找一些驚艷的項目或者工具。不過用的時間久了,發現它的用戶體驗實在是不敢恭維,有時候會讓你做很多重復操作,浪費不少時間。 比如我想單獨下載一 ...
背景 我們項目中現有日志系統,采用的是slf4j+logback這套日志組件,也是Java生態里面比較常用的一個日志組件,但是隨着分布式的演進,這套組件明顯存在以下幾個問題: 1.各種無關日志穿行其中,導致我們可能無法直接定位整個操作流程 ...
Story background 回望2018年12月,這也許是程序員們日夜不得安寧的日子,皆因各種前線的系統使用者都需要沖業績等原因,往往在這個時候會向系統同時寫入海量的數據,當我們的應用 ...
日常Bug排查-消息不消費 前言 日常Bug排查系列都是一些簡單Bug排查,筆者將在這里介紹一些排查Bug的簡單技巧,同時順便積累素材_。 Bug現場 某天下午,在筆者研究某個問題正high的時候。開發突然找到筆者,線上某個系統突然消費不了queue了。Queue不消費也算是日常問題了。淡 ...
兩個流程鏈路問題的排查和總結 原創 編程一生 編程一生 8月13日 亂碼問題 現象 在一類簡單的業務場景下發起http請求的測試案例,返回的時候會100%有亂碼。如果跳過跟廠商定制的7層負載均衡設備,直接連后端一台機器,則100%無亂碼。在其 ...
本文為博主原創,未經允許不得轉載: 在開發過程中,經常會使用log記錄一下當前請求的參數,過程和結果,以便幫助定位問題。在並發量下的情況下,日志打印不會劇增,可以很快就能通過打印的日志查看執行的情況。但是在高並發大量請求的場景下,日志也會頻繁打印,刷新,通過查看日志來定位問題時就會變得 ...
注意:在公眾號 可以獲取更多資料 今天線上查bug,使用上了鏈路追蹤,真的很方便,同一個請求,調用的所有服務的日志,能根據Trace Id篩選出來,效率提高了很多。 所以,項目加鏈路追蹤的決定,是非常正確的選擇。 以前,線上環境有問題,為了查詢日志,運維工程師登錄 ...