容器監控實踐—cAdvisor


概述

為了解決docker stats的問題(存儲、展示),谷歌開源的cadvisor誕生了,cadvisor不僅可以搜集一台機器上所有運行的容器信息,還提供基礎查詢界面和http接口,方便其他組件如Prometheus進行數據抓取,或者cadvisor + influxdb + grafna搭配使用。

cAdvisor可以對節點機器上的資源及容器進行實時監控和性能數據采集,包括CPU使用情況、內存使用情況、網絡吞吐量及文件系統使用情況

Cadvisor使用Go語言開發,利用Linux的cgroups獲取容器的資源使用信息,在K8S中集成在Kubelet里作為默認啟動項,官方標配。

安裝

  • 1.使用二進制部署
下載二進制:https://github.com/google/cadvisor/releases/latest 本地運行:./cadvisor -port=8080 &>>/var/log/cadvisor.log 
  • 2.使用docker部署
docker run \
  --volume=/:/rootfs:ro \ --volume=/var/run:/var/run:rw \ --volume=/sys:/sys:ro \ --volume=/var/lib/docker/:/var/lib/docker:ro \ --volume=/dev/disk/:/dev/disk:ro \ --publish=8080:8080 \ --detach=true \ --name=cadvisor \ google/cadvisor:latest 
注意:

在Ret Hat,CentOS, Fedora 等發行版上需要傳遞如下參數,因為 SELinux 加強了安全策略:

--privileged=true 啟動后訪問:http://127.0.0.1:8080查看頁面,/metric查看指標 
* 常見指標:http://yjph83.iteye.com/blog/2394091 * 指標分析:https://luoji.live/cadvisor/cadvisor-source-code-metrics-20160927.html` 
  • 3.kubernetes中使用
* Daemonset部署: https://github.com/google/cadvisor/tree/master/deploy/kubernetes * kubelet自帶cadvisor監控所有節點,可以設置--cadvisor-port=8080指定端口(默認為4194) * kubernetes 在2015-03-10 這個提交(Run cAdvisor inside the Kubelet. Victor Marmol 2015/3/10 13:39)中cAdvisor開始集成在kubelet中,目前的1.6及以后均存在 

注意:

從 v1.7 開始,Kubelet metrics API 不再包含 cadvisor metrics,而是提供了一個獨立的 API 接口: * Kubelet metrics: http://127.0.0.1:8001/api/v1/proxy/nodes/<node-name>/metrics * Cadvisor metrics: http://127.0.0.1:8001/api/v1/proxy/nodes/<node-name>/metrics/cadvisor cadvisor 監聽的端口將在 v1.12 中刪除,建議所有外部工具使用 Kubelet Metrics API 替代。 

常用搭配

1.cAdvisor+Heapster+influxdb

 

 
 
Heapster:在k8s集群中獲取metrics和事件數據,寫入InfluxDB,heapster收集的數據比cadvisor多,卻全,而且存儲在influxdb的也少。
Heapster將每個Node上的cAdvisor的數據進行匯總,然后導到InfluxDB。

Heapster的前提是使用cAdvisor采集每個node上主機和容器資源的使用情況,
再將所有node上的數據進行聚合。

這樣不僅可以看到Kubernetes集群的資源情況,
還可以分別查看每個node/namespace及每個node/namespace下pod的資源情況。 可以從cluster,node,pod的各個層面提供詳細的資源使用情況。 
  • InfluxDB:時序數據庫,提供數據的存儲,存儲在指定的目錄下。

  • Grafana:提供了WEB控制台,自定義查詢指標,從InfluxDB查詢數據並展示。

cAdvisor+Prometheus+Grafana

訪問http://localhost:8080/metrics,可以拿到cAdvisor暴露給 Prometheus的數據

 其他內容參考后續的prometheus文章

深入解析

cAdvisor結構圖

 cadvisor地址:https://github.com/google/cadvisor

主函數邏輯:(cadvisor/cadvisor.go)

通過new出來的memoryStorage以及sysfs實例,創建一個manager實例,manager的interface中定義了許多用於獲取容器和machine信息的函數

核心函數:

 

 生成manager實例的時候,還需要傳遞兩個額外的參數,分別是
  • maxHousekeepingInterval:存在內存的時間,默認60s
  • allowDynamicHousekeeping:是否允許動態配置housekeeping,也就是下一次開始搜集容器信息的時間,默認true

因為需要暴露服務,所以在handler文件中,將上面生成的containerManager注冊進去(cadvisor/http/handler.go),之后就是啟動manager,運行其Start方法,開始搜集信息,存儲信息的循環操作。

以memory采集為例:

 具體的信息還是通過runc/libcontainer獲得,libcontainer是對cgroup的封裝。在/sys/fs/cgroup/memory中包含大量的了memory相關的信息(參考docker原生監控文章)

Prometheus的收集器(cadvisor/metrics/prometheus.go)


 

更多源碼參考文章:https://luoji.live/categories/cadvisor/

總結

優缺點:

  • 優點:谷歌開源產品,監控指標齊全,部署方便,而且有官方的docker鏡像。
  • 缺點:是集成度不高,默認只在本地保存1分鍾數據,但可以集成InfluxDB等存儲

備注:

愛奇藝參照cadvisor開發的dadvisor,數據寫入graphite,
等同於cadvisor+influxdb,但dadvisor並沒有開源

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM