原文:如何扩展单个Prometheus实现近万Kubernetes集群监控?

引言 TKE团队负责公有云,私有云场景下近万个集群,数百万核节点的运维管理工作。为了监控规模如此庞大的集群联邦,TKE团队在原生Prometheus的基础上进行了大量探索与改进,研发出一套可扩展,高可用且兼容原生配置的Prometheus集群系统,理论上可支持无限的series数目和存储容量,支持纳管TKE集群,EKS集群以及自建K s集群的监控诉求。 本文从TKE的架构出发,逐步介绍了整个监控系 ...

2020-08-31 18:24 0 1781 推荐指数:

查看详情

prometheus operator(Kubernetes 集群监控

一、Prometheus Operator 介绍 Prometheus Operator 是 CoreOS 开发的基于 PrometheusKubernetes 监控方案,也可能是目前功能最全面的开源方案。 Prometheus Operator架构图 二、安装 ...

Thu Aug 08 22:54:00 CST 2019 0 808
kube-prometheus 监控kubernetes集群

一、概述 1、Prometheus简介 Prometheus是一个开源的服务监控系统和时序数据库,其提供了通用的数据模型和快捷数据采集、存储和查询接口。它的核心组件Prometheus服务器定期从静态配置的监控目标或者基于服务发现自动配置的目标中进行拉取数据,新拉取到啊的 数据 ...

Tue Jan 26 18:19:00 CST 2021 0 940
如何用Prometheus监控十万container的Kubernetes集群

概述 不久前,我们在文章《如何扩展单个Prometheus实现Kubernetes集群监控?》中详细介绍了TKE团队大规模Kubernetes联邦监控系统Kvass的演进过程,其中介绍了针对规模较大的集群,我们是如何通过修改Prometheus代码来实现横向扩缩容的。经过方案上的改进 ...

Wed Nov 25 19:36:00 CST 2020 0 598
如何构建Kubernetes集群场景下的etcd监控平台?

周成,腾讯云工程师,主要负责腾讯etcd监控平台设计、开发、运维工作,具备大规模Kubernetes和etcd集群运维开发经验。 唐聪,腾讯云资深工程师,极客时间专栏《etcd实战课》作者,etcd活跃贡献者, 主要负责腾讯云级K8s集群和内部业务的公共etcd平台以及serverless产品 ...

Thu Mar 11 18:26:00 CST 2021 0 360
050.Kubernetes集群管理-Prometheus+Grafana监控方案

Prometheus概述 1.1 Prometheus简介 Prometheus是由SoundCloud公司开发的开源监控系统,是继Kubernetes之后CNCF第2个毕业的项目,在容器和微服务领域得到了广泛应用。Prometheus的主要特点 ...

Thu Mar 26 00:55:00 CST 2020 0 1409
部署prometheus监控kubernetes集群并存储到ceph

简介 Prometheus 最初是 SoundCloud 构建的开源系统监控和报警工具,是一个独立的开源项目,于2016年加入了 CNCF 基金会,作为继 Kubernetes 之后的第二个托管项目。 特征 ​ Prometheus 相比于其他传统监控工具主要有以下几个特点: ​ 具有 ...

Sat Mar 21 05:35:00 CST 2020 0 1314
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM