MinIO監控指南


官方文檔地址:http://docs.minio.org.cn/docs/master/minio-monitoring-guide

MinIO服務器通過端點公開監視數據。監視工具可以從這些端點中選擇數據。

健康檢查探針

MinIO服務器具有兩個與運行狀況檢查相關的未經身份驗證的端點,一個活動性探針(指示服務器是否工作正常),一個就緒性探針(指示服務器是否由於重負載而未接受連接)。

  • 活力探針: /minio/health/live
  • 就緒探針: /minio/health/ready

Prometheus 探測

MinIO服務器在單個端點上公開與Prometheus兼容的數據。默認情況下,對端點進行身份驗證。

  • Prometheus 數據可在 /minio/prometheus/metrics

要使用此端點,請設置Prometheus以從該端點抓取數據。

使用Prometheus監控MinIO服務器

MinIO默認情況下將Prometheus兼容數據作為授權端點導出/minio/prometheus/metrics。希望監視其MinIO實例的用戶可以指向Prometheus配置,以從該終結點抓取數據。

為Prometheus指標配置身份驗證類型

MinIO支持Prometheus jwt或兩種身份驗證模式public,默認情況下,MinIO以jwt mode 運行。要允許對prometheus度量標准不進行身份驗證就可以進行公共訪問,請按如下所示設置環境。

export MINIO_PROMETHEUS_AUTH_TYPE="public"
minio server ~/test

經過身份驗證的Prometheus配置

MinIO中的Prometheus端點默認需要身份驗證。Prometheus支持使用承載令牌方法對Prometheus抓取請求進行身份驗證,並使用mc生成的默認Prometheus配置覆蓋默認的Prometheus配置。要為別名生成Prometheus配置,請使用mc,如下所示mc admin prometheus generate

該命令將生成scrape_configs prometheus.yml 的部分,如下所示:

scrape_configs:
- job_name: minio-job
  bearer_token: <secret>
  metrics_path: /minio/prometheus/metrics
  scheme: http
  static_configs:
  - targets: ['localhost:9000']

Public Prometheus配置

如果Prometheus端點身份驗證類型設置為public。遵循prometheus的配置足以開始從MinIO抓取指標數據。

scrape_configs:
- job_name: minio-job
  metrics_path: /minio/prometheus/metrics
  scheme: http
  static_configs:
  - targets: ['localhost:9000']

scrape_configs 更新部分prometheus.yml

要授權每個刮取請求,請將生成的scrape_configs部分復制並粘貼到prometheus.yml中,然后重新啟動Prometheus服務。

MinIO公開的指標列表

MinIO服務器在/ minio / prometheus / metrics端點上公開以下指標。 所有這些都可以通過Prometheus儀表板進行訪問。 演示服務器的https://play.min.io:9000/minio/prometheus/metrics 中提供了暴露指標的完整列表及其定義。

這些是將在之后生效的新指標集RELEASE.2019-10-16*。下面列出了此更新中的一些關鍵更改。 -指標綁定到各個節點,並且不在群集范圍內。集群中的每個節點都將公開自己的指標。 -添加了涵蓋s3和節點間流量統計信息的其他指標。 -記錄http統計信息和延遲的度量標准被標記為其各自的API(putobject,getobject等)。 -磁盤使用情況指標已分發並標記到相應的磁盤路徑。

指標列表及其定義如下。(注意:這里的實例是一個MinIO節點)

  • 標准go運行時指標的前綴 go_
  • 流程級別指標以開頭 process_
  • prometheus 抓取以開頭的指標 promhttp_
  • disk_storage_used : 磁盤使用的磁盤空間。
  • disk_storage_available: 磁盤上剩余的可用磁盤空間。
  • disk_storage_total: 磁盤上的總磁盤空間。
  • minio_disks_offline: 當前MinIO實例中的脫機磁盤總數。
  • minio_disks_total: 當前MinIO實例中的磁盤總數。
  • s3_requests_total: 當前MinIO實例中s3請求的總數。
  • s3_errors_total: 當前MinIO實例中s3請求中的錯誤總數。
  • s3_requests_current: 當前MinIO實例中活動s3請求的總數。
  • internode_rx_bytes_total: 當前MinIO服務器實例接收到的節點間字節總數。
  • internode_tx_bytes_total: 當前MinIO服務器實例發送到其他節點的字節總數。
  • s3_rx_bytes_total: 當前MinIO服務器實例接收的s3字節總數。
  • s3_tx_bytes_total: 當前MinIO服務器實例發送的s3字節總數。
  • minio_version_info: 具有提交ID的當前MinIO版本。
  • s3_ttfb_seconds: 保存請求的延遲信息的直方圖。

緩存特定指標

啟用了磁盤緩存的MinIO Gateway實例公開了與緩存相關的指標。

  • cache_data_served:cache_data_served:從緩存提供的總字節數。
  • cache_hits_total:cache_hits_total:緩存命中總數。
  • cache_misses_total:cache_misses_total:緩存未命中總數。

MinIO自愈指標 - self_heal_*

MinIO 僅針對擦除代碼部署公開與自我修復相關的指標。這些度量標准在網關或單節點單驅動器部署中不可用。請注意,只有在MinIO服務器上發生相關事件時,才會公開這些指標。

  • self_heal_time_since_last_activity:自上一次自我修復相關活動以來經過的時間。
  • self_heal_objects_scanned:在當前運行中由自愈線程掃描的對象數。重新開始自我修復運行時,它將重置。這用掃描的對象類型標記。
  • self_heal_objects_healed: 當前運行中通過自愈線程修復的對象數。重新開始自我修復運行時,它將重置。這用掃描的對象類型標記。
  • self_heal_objects_heal_failed:當前運行中自愈失敗的對象數。重新開始自我修復運行時,它將重置。這被標記為磁盤狀態及其端點。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM