個推基於 Zipkin 的分布式鏈路追蹤實踐



作者:個推應用平台基礎架構高級研發工程師 阿飛
 
01業務背景
 
隨着微服務架構的流行,系統變得越來越復雜,單體的系統被拆成很多個模塊,各個模塊通過輕量級的通信協議進行通訊,相互協作,共同實現系統功能。
 
單體架構時,一個請求的調用鏈路很清晰,一般由負載均衡器將用戶請求轉發到后端服務,由后端服務進行業務處理,需要的數據從外部的存儲中獲取,處理完請求后,再經由負載均衡器返回給用戶。
 
而在微服務架構中,一個請求往往需要多個模塊共同協作處理,不同模塊可能還依賴於不同的外部存儲,各個模塊的實現技術還不盡相同,一個請求是如何在整個系統不同模塊間進行流轉,整個調用鏈上的各個模塊之間的調用關系如何,每個微服務處理的時間長短,處理的結果是否正確,很難去進行追蹤,而這些信息對於整個系統運維、性能分析、故障追蹤都特別有幫助,也正因為此,才有了各種分布式鏈路追蹤的技術。
 
02分布式鏈路追蹤現狀
 
分布式鏈路追蹤的技術有很多,有開源的也有閉源的。開源的有Jaeger、PinPoint、Zipkin、SkyWalking、CAT等,閉源的有Google Dapper、淘寶的鷹眼Tracing、新浪的Watchman、美團的MTrace等。CNCF(Cloud Native Computing Foundation)為了解決業界分布式追蹤系統跨平台兼容性問題,設計了trace的標准,提出了分布式跟蹤系統產品的統一范式-OpenTracing,Zipkin也部分支持OpenTracing標准。
 
03選擇Zipkin的原因
 
在實踐的過程中,基於以下原因選擇了Zipkin來進行鏈路追蹤:
• 開源,社區活躍
• 支持多種語言,Nodejs,Lua,Java都有開源實現,而我們的服務主要是這三種語言實現的
• 提供查詢API,方便二次開發
 
04Zipkin的架構介紹
 
Zipkin的整體架構如下圖所示:
 

Zipkin的整體架構
(引用自Zipkin官網:https://zipkin.io/pages/architecture.html)
 
其中:
•  Instrumented client和Instrumented server需要集成在分布式系統的具體服務中,采集跟蹤信息,調用Transport,把跟蹤信息發送給Zipkin的Server。
• Transport是Zipkin對外提供的接口,支持HTTP、Kafka、Scribe等通信方式。
•  Zipkin即Zipkin server,主要包括四個模塊:
Collector: 用於接收各個應用服務傳輸的追蹤信息;
Storage:Zipkin的后端存儲,支持In-Memory、MySql、Elasticsearch和Cassandra;
API:提供對外的查詢接口;
UI:提供對外的Web界面。

Http Tracing的時序圖
(引用自Zipkin官網:https://zipkin.io/pages/architecture.html)
 
以上是Http Tracing的時序圖,用戶的請求/foo首先被Trace Instrumentationlan攔截,記錄下Tags,時間戳,同時在Header里增加Trace信息,然后再流轉到后端服務進行處理,處理完成后,正常響應,Trace Instrumentationlan攔截響應,記錄處理延時后,將Response正常返回給調用方,同時異步地將Trace的Span發送給Zipkin Server。Span中的traceId是在整個調用鏈路上唯一的ID,用於唯一標識一條調用鏈。
 
05個推的Zipkin實踐
 
個推的微服務是基於Kubernetes和Docker進行部署的,每個微服務對應於Kubernetes中的一組Pod。
在整個微服務體系中,API網關是基於Openresty開發的,主要使用Lua進行開發;后端服務主要使用Node.js和Java進行開發實現。在對接Zipkin時,不同的微服務采用不同的方式進行實現。
API網關主要通過增加網關插件(主要參考了Kong的Zipkin插件實現)來實現與Zipkin的對接;Node.js實現的服務主要使用了中間件實現與Zipkin的對接;Java服務使用了spring-cloud-sleuth來與Zipkin對接。 整體的架構如下圖所示:

個推基於Zipkin的分布式鏈路追蹤系統的整體架構
 
其中,Zipkin也容器化部署在Kubernetes集群中,簡化了Zipkin的搭建和部署。如下圖所示,通過Zipkin可以很方便地追蹤請求的調用鏈路,整個調用鏈上各個服務的處理耗時,響應狀態,服務間的調用關系都可以方便地在Zipkin中進行查詢。Zipkin對於分析整個系統的性能瓶頸,定位故障也都有很大的幫助。

Zipkin的Web界面
 
06總結
 
Zipkin作為一個分布式鏈路追蹤系統,有着應用侵入較小、社區活躍度較高、支持多種語言等優勢,一般基於開源的實現稍做修改就可以實現與Zipkin的對接。因此個推在微服務架構中也引入了Zipkin,用Zipkin來追蹤微服務的調用關系,對微服務進行性能分析和故障診斷。未來,個推會基於Zipkin做二次開發,提供更為友好的界面。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM