注意:在公眾號
可以獲取更多資料
今天線上查bug,使用上了鏈路追蹤,真的很方便,同一個請求,調用的所有服務的日志,能根據Trace Id篩選出來,效率提高了很多。
所以,項目加鏈路追蹤的決定,是非常正確的選擇。
以前,線上環境有問題,為了查詢日志,運維工程師登錄服務器,下載日志,轉發日志文件,研發工程師分析日志文件,這種查詢日志模式很繁瑣。
隨着服務的拆分,日志系統也演變成獨立自治的單一模塊。為了查詢日志,我們可能需要登錄不同的服務器去一個個下載日志分析。因此,構建日志聚合平台是必不可少的。事實上,規范整個系統日志體系,采用標准的日志格式非常便於后續的日志聚合檢索。
所以在項目拆分后,我們首先做的事情是統一日志格式,日志聚合與全鏈路監控。實現生產環境,研發人員直接查找日志,定位問題,不需要經過運維;
我們采用ELK進行日志聚合,采用Spring Cloud Sleuth數據埋點,收集服務調用鏈路上的數據。
其他。。。
1.堆棧異常信息處理
全局業務異常一般不打印堆棧信息,對於不明原因的異常,需要打印堆棧信息。對於堆棧異常,我們整合成了一行日志,可以在elk中查看堆棧異常;
2.elk毫秒級日志錯亂問題
對於單用戶,單請求,毫秒級日志導致的亂序問題,忽略不計
推薦書籍
《領域驅動設計》復雜業務需要建模,統一概念,適合整個產品,研發。
京東地址:https://u.jd.com/NVm7gK