系統開發到一定的階段,線上的機器越來越多,就需要一些監控了,除了服務器的監控,業務方面也需要一些監控服務。Metrics
作為一款監控指標
的度量類庫,提供了許多工具幫助開發者來完成自定義的監控工作。
使用Metrics
通過構建一個Spring Boot
的基本應用來演示Metrics
的工作方式。
在Maven的pom.xml
中引入Metrics
:
<dependency> <groupId>io.dropwizard.metrics</groupId> <artifactId>metrics-core</artifactId> <version>${metrics.version}</version> </dependency>
目前Metrics
的最新版本是3.1.2
。
Metrics的基本工具
Metrics
提供了五個基本的度量類型:
- Gauges(度量)
- Counters(計數器)
- Histograms(直方圖數據)
- Meters(TPS計算器)
- Timers(計時器)
Metrics
中MetricRegistry
是中心容器,它是程序中所有度量的容器,所有新的度量工具都要注冊到一個MetricRegistry
實例中才可以使用,盡量在一個應用中保持讓這個MetricRegistry
實例保持單例。
MetricRegistry 容器
在代碼中配置好這個MetricRegistry
容器:
@Bean public MetricRegistry metrics() { return new MetricRegistry(); }
Meters TPS計算器
TPS計算器
這個名稱並不准確,Meters
工具會幫助我們統計系統中某一個事件的速率。比如每秒請求數(TPS),每秒查詢數(QPS)等等。這個指標能反應系統當前的處理能力,幫助我們判斷資源是否已經不足。Meters
本身是一個自增計數器。
通過MetricRegistry
可以獲得一個Meter
:
@Bean public Meter requestMeter(MetricRegistry metrics) { return metrics.meter("request"); }
在請求中調用mark()
方法,來增加計數,我們可以在不同的請求中添加不同的Meter
,針對自己的系統完成定制的監控需求。
@RequestMapping("/hello") @ResponseBody public String helloWorld() { requestMeter.mark(); return "Hello World"; }
應用運行的過程中,在console中反饋的信息:
-- Meters ----------------------------------------------------------------------
request
count = 21055
mean rate = 133.35 events/second
1-minute rate = 121.66 events/second
5-minute rate = 36.99 events/second
15-minute rate = 13.33 events/second
從以上信息中可以看出Meter
可以為我們提供平均速率,以及采樣后的1分鍾,5分鍾,15分鍾的速率。
Histogram 直方圖數據
直方圖是一種非常常見的統計圖表,Metrics
通過這個Histogram
這個度量類型提供了一些方便實時繪制直方圖的數據。
和之前的Meter
相同,我們可以通過MetricRegistry
來獲得一個Histogram
。
@Bean public Histogram responseSizes(MetricRegistry metrics) { return metrics.histogram("response-sizes"); }
在應用中,需要統計的位置調用Histogram
的update()
方法。
responseSizes.update(new Random().nextInt(10));
比如我們需要統計某個方法的網絡流量,通過Histogram
就非常的方便。
在console中Histogram
反饋的信息:
-- Histograms ------------------------------------------------------------------
response-sizes
count = 21051 min = 0 max = 9 mean = 4.55 stddev = 2.88 median = 4.00 75% <= 7.00 95% <= 9.00 98% <= 9.00 99% <= 9.00 99.9% <= 9.00
Histogram
為我們提供了最大值,最小值和平均值等數據,利用這些數據,我們就可以開始繪制自定義的直方圖了。
Counter 計數器
Counter
的本質就是一個AtomicLong
實例,可以增加或者減少值,可以用它來統計隊列中Job的總數。
通過MetricRegistry
也可以獲得一個Counter
實例。
@Bean public Counter pendingJobs(MetricRegistry metrics) { return metrics.counter("requestCount"); }
在需要統計數據的位置調用inc()
和dec()
方法。
// 增加計數 pendingJobs.inc(); // 減去計數 pendingJobs.dec();
console的輸出非常簡單:
-- Counters --------------------------------------------------------------------
requestCount
count = 21051
只是輸出了當前度量的值。
Timer 計時器
Timer
是一個Meter
和Histogram
的組合。這個度量單位可以比較方便地統計請求的速率和處理時間。對於接口中調用的延遲等信息的統計就比較方便了。如果發現一個方法的RPS(請求速率)
很低,而且平均的處理時間很長,那么這個方法八成出問題了。
同樣,通過MetricRegistry
獲取一個Timer
的實例:
@Bean public Timer responses(MetricRegistry metrics) { return metrics.timer("executeTime"); }
在需要統計信息的位置使用這樣的代碼:
final Timer.Context context = responses.time(); try { // handle request } finally { context.stop(); }
console中就會實時返回這個Timer
的信息:
-- Timers ----------------------------------------------------------------------
executeTime
count = 21061 mean rate = 133.39 calls/second 1-minute rate = 122.22 calls/second 5-minute rate = 37.11 calls/second 15-minute rate = 13.37 calls/second min = 0.00 milliseconds max = 0.01 milliseconds mean = 0.00 milliseconds stddev = 0.00 milliseconds median = 0.00 milliseconds 75% <= 0.00 milliseconds 95% <= 0.00 milliseconds 98% <= 0.00 milliseconds 99% <= 0.00 milliseconds 99.9% <= 0.01 milliseconds
Gauges 度量
除了Metrics
提供的幾個度量類型,我們可以通過Gauges
完成自定義的度量類型。比方說很簡單的,我們想看我們緩存里面的數據大小,就可以自己定義一個Gauges
。
metrics.register( MetricRegistry.name(ListManager.class, "cache", "size"), (Gauge<Integer>) () -> cache.size() );
這樣Metrics
就會一直監控Cache
的大小。
除此之外有時候,我們需要計算自己定義的一直單位,比如消息隊列里面消費者(consumers)消費的速率和生產者(producers)的生產速率的比例,這也是一個度量。
public class CompareRatio extends RatioGauge { private final Meter consumers; private final Meter producers; public CacheHitRatio(Meter consumers, Meter producers) { this.consumers = consumers; this.producers = producers; } @Override protected Ratio getRatio() { return Ratio.of(consumers.getOneMinuteRate(), producers.getOneMinuteRate()); } }
把這個類也注冊到Metrics
容器里面:
@Bean public CompareRatio cacheHitRatio(MetricRegistry metrics, Meter requestMeter, Meter producers) { CompareRatio compareRatio = new CompareRatio(consumers, producers); metrics.register("生產者消費者比率", compareRatio); return cacheHitRatio; }
Reporter 報表
Metrics
通過報表,將采集的數據展現到不同的位置,這里比如我們注冊一個ConsoleReporter
到MetricRegistry
中,那么console中就會打印出對應的信息。
@Bean public ConsoleReporter consoleReporter(MetricRegistry metrics) { return ConsoleReporter.forRegistry(metrics) .convertRatesTo(TimeUnit.SECONDS) .convertDurationsTo(TimeUnit.MILLISECONDS) .build(); }
除此之外Metrics
還支持JMX
、HTTP
、Slf4j
等等,可以訪問 http://metrics.dropwizard.io/3.1.0/manual/core/#reporters 來查看Metrics
提供的報表,如果還是不能滿足自己的業務,也可以自己繼承Metrics
提供的ScheduledReporter
類完成自定義的報表類。
完整的代碼
這個demo是在一個很簡單的spring boot下運行的,關鍵的幾個類完整代碼如下。
配置類MetricConfig.java
package demo.metrics.config; import com.codahale.metrics.*; import org.slf4j.LoggerFactory; import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Configuration; import java.util.concurrent.TimeUnit; @Configuration public class MetricConfig { @Bean public MetricRegistry metrics() { return new MetricRegistry(); } /** * Reporter 數據的展現位置 * * @param metrics * @return */ @Bean public ConsoleReporter consoleReporter(MetricRegistry metrics) { return ConsoleReporter.forRegistry(metrics) .convertRatesTo(TimeUnit.SECONDS) .convertDurationsTo(TimeUnit.MILLISECONDS) .build(); } @Bean public Slf4jReporter slf4jReporter(MetricRegistry metrics) { return Slf4jReporter.forRegistry(metrics) .outputTo(LoggerFactory.getLogger("demo.metrics")) .convertRatesTo(TimeUnit.SECONDS) .convertDurationsTo(TimeUnit.MILLISECONDS) .build(); } @Bean public JmxReporter jmxReporter(MetricRegistry metrics) { return JmxReporter.forRegistry(metrics).build(); } /** * 自定義單位 * * @param metrics * @return */ @Bean public ListManager listManager(MetricRegistry metrics) { return new ListManager(metrics); } /** * TPS 計算器 * * @param metrics * @return */ @Bean public Meter requestMeter(MetricRegistry metrics) { return metrics.meter("request"); } /** * 直方圖 * * @param metrics * @return */ @Bean public Histogram responseSizes(MetricRegistry metrics) { return metrics.histogram("response-sizes"); } /** * 計數器 * * @param metrics * @return */ @Bean public Counter pendingJobs(MetricRegistry metrics) { return metrics.counter("requestCount"); } /** * 計時器 * * @param metrics * @return */ @Bean public Timer responses(MetricRegistry metrics) { return metrics.timer("executeTime"); } }
接收請求的類MainController.java
package demo.metrics.action; import com.codahale.metrics.Counter; import com.codahale.metrics.Histogram; import com.codahale.metrics.Meter; import com.codahale.metrics.Timer; import demo.metrics.config.ListManager; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.stereotype.Controller; import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.web.bind.annotation.ResponseBody; import java.util.Random; @Controller @RequestMapping("/") public class MainController { @Autowired private Meter requestMeter; @Autowired private Histogram responseSizes; @Autowired private Counter pendingJobs; @Autowired private Timer responses; @Autowired private ListManager listManager; @RequestMapping("/hello") @ResponseBody public String helloWorld() { requestMeter.mark(); pendingJobs.inc(); responseSizes.update(new Random().nextInt(10)); listManager.getList().add(1); final Timer.Context context = responses.time(); try { return "Hello World"; } finally { context.stop(); } } }
項目啟動類DemoApplication.java
:
package demo.metrics; import com.codahale.metrics.ConsoleReporter; import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.SpringBootApplication; import org.springframework.context.ApplicationContext; import java.util.concurrent.TimeUnit; @SpringBootApplication public class DemoApplication { public static void main(String[] args) { ApplicationContext ctx = SpringApplication.run(DemoApplication.class, args); // 啟動Reporter ConsoleReporter reporter = ctx.getBean(ConsoleReporter.class); reporter.start(1, TimeUnit.SECONDS); } }
這里再配合Influxdb
和Grafana
可以構建一個非常漂亮的實時監控界面。

采集數據(Metrics)-> 存儲數據(InfluxDB) -> 顯示數據(Grafana)。
資源有限,我把這一套服務搭建在了一台CentOS 7
的服務器上。
安裝influxdb
InfluxDB
是Go語言寫的一個時序型數據庫,可以通過rpm的方式來安裝它,這里最好能安裝InfluxDB
的最新版本,否則跟Grafana
的交互會有一些不兼容。
wget http://dl.influxdata.com/influxdb/releases/influxdb-0.12.2-1.x86_64.rpm yum localinstall influxdb-0.12.2-1.x86_64.rpm
安裝完成之后,啟動並查看這個服務是否在正常運行:
systemctl start influxdb.service
[root@metrics ~]# systemctl status influxdb.service ● influxdb.service - InfluxDB is an open-source, distributed, time series database Loaded: loaded (/usr/lib/systemd/system/influxdb.service; enabled; vendor preset: disabled) Active: active (running) since 一 2016-04-25 17:50:04 CST; 1 day 1h ago Docs: https://docs.influxdata.com/influxdb/ Main PID: 17871 (sh) CGroup: /system.slice/influxdb.service ├─17871 /bin/sh -c /usr/bin/influxd -config /etc/influxdb/influxdb.conf >>/dev/nul... └─17872 /usr/bin/influxd -config /etc/influxdb/influxdb.conf 4月 25 17:50:04 metrics systemd[1]: Started InfluxDB is an open-source, distributed...se. 4月 25 17:50:04 metrics systemd[1]: Starting InfluxDB is an open-source, distribute...... Hint: Some lines were ellipsized, use -l to show in full.
啟動后打開 web 管理界面 http://192.168.2.183:8083/ 默認用戶名和密碼是 root 和 root. InfluxDB 的 Web 管理界面端口是 8083,HTTP API 監聽端口是 8086,如果需要更改這些默認設定,修改 InfluxDB 的配置文件(/etc/influxdb/influxdb.conf)並重啟就可以了。
安裝 Grafana
Grafana
是一個非常好看的監控界面,它的安裝方式也非常簡單,通過yum
,一條命令就可以在server上完成安裝。
yum install https://grafanarel.s3.amazonaws.com/builds/grafana-3.0.0-beta51460725904.x86_64.rpm
完成安裝之后,啟動並檢查它的狀態:
[root@metrics ~]# systemctl start grafana-server.service [root@metrics ~]# systemctl status grafana-server.service ● grafana-server.service - Starts and stops a single grafana instance on this system Loaded: loaded (/usr/lib/systemd/system/grafana-server.service; disabled; vendor preset: disabled) Active: active (running) since 一 2016-04-25 09:37:07 CST; 1 day 10h ago Docs: http://docs.grafana.org Main PID: 10309 (grafana-server) CGroup: /system.slice/grafana-server.service └─10309 /usr/sbin/grafana-server --config=/etc/grafana/grafana.ini --pidfile= cfg:d...
用瀏覽器訪問 Grafana
,默認端口是3000
,默認的帳號密碼都是 admin(可以在配置文件中找到),登錄之后配置數據庫

Metrics Reporter
之前提到Metrics
只需要配置它的Reporter
就可以輸出到對應的地方,對於Influxdb
,在github
上找到了一個Influxdb
的Reporter
(https://github.com/davidB/metrics-influxdb)。
在Maven
中引入:
<dependency> <groupId>com.github.davidb</groupId> <artifactId>metrics-influxdb</artifactId> <version>0.8.2</version> </dependency>
並在代碼中配置Influxdb
的數據源:
@Bean(name = "influxdbReporter") public ScheduledReporter influxdbReporter(MetricRegistry metrics) throws Exception { return InfluxdbReporter.forRegistry(metrics) .protocol(InfluxdbProtocols.http("host_ip_address", port, "username", "password", "database")) .convertRatesTo(TimeUnit.SECONDS) .convertDurationsTo(TimeUnit.MILLISECONDS) .filter(MetricFilter.ALL) .skipIdleMetrics(false) .build(); }
啟動項目之后,我們開始配置我們需要看到的圖表信息:

最后我們利用wrk
測試工具並發訪問連接:
➜ ~ wrk -t 10 -c 50 -d 5s http://127.0.0.1:8888/hello Running 5s test @ http://127.0.0.1:8888/hello 10 threads and 50 connections Thread Stats Avg Stdev Max +/- Stdev Latency 6.59ms 12.17ms 210.05ms 92.16% Req/Sec 1.40k 427.51 2.79k 71.80% 69902 requests in 5.04s, 10.28MB read Requests/sec: 13873.71 Transfer/sec: 2.04MB
於此同時Grafana
界面上系統實時的數據信息也展現出來了:

轉載:https://www.jianshu.com/p/e4f70ddbc287