前言
leader 讓給生產服務器上 tomcat 錯誤日志監控起來,我們的應用使用的日志框架是logback
,google 找到了一個 logstash 和logback 集成的好工具,logstash-logback-encoder。
之前流程,客戶在使用過程中遇到問題,我們手動的上生產服務器翻看catalina.out
那個時間點的日志來排錯。我想實現通過日志監控,將日志按照系統名稱、日志類型、日志級別、日志信息、日志堆棧來切割,並輸出到 elasticsearch,同時集成了 zabbix,日志信息輸出到 elasticsearch 的同時還能同時進行郵件預警,將錯誤信息直接通過郵件發送。
通過 logstash 輸出到 elasticsearch
配置 logback 的 appender,將系統錯誤日志解析成 json 的格式,並通過 UDP 的方式上傳到 logstash,logstash 配置UDP的input,存到 elasticsearch。
logback.xml配置
我使用的是UDP Appender
堆棧信息配置參見Customizing Stack Traces
<appender name="stash" class="net.logstash.logback.appender.LogstashSocketAppender"> <!--logstash服務器IP--> <host>127.0.0.1</host> <!-- port is optional (default value shown) --> <port>514</port> <customFields>{"appname":"bdcor2"}</customFields> <encoder class="net.logstash.logback.encoder.LogstashEncoder"> <throwableConverter class="net.logstash.logback.stacktrace.ShortenedThrowableConverter"> <!--正則匹配的日志信息不輸出--> <exclude>sun\.reflect\..*\.invoke.*</exclude> <exclude>net\.sf\.cglib\.proxy\.MethodProxy\.invoke</exclude> <exclude>org.*</exclude> <rootCauseFirst>true</rootCauseFirst> </throwableConverter> </encoder> </appender> <root level="ERROR"> <appender-ref ref="stash"/> </root>
logstash配置
配置Input plugins,默認的bugger_size
是8192,指從網絡讀取的數據包大小,開始測試的時候,堆棧日志太長,輸出到logstash,一直報_jsonparsefailure
,日志信息被截取。
tips: 開啟1-1024之間的端口,必須使用root用戶
udp { port => 514 codec => "json" type => "syslog" buffer_size => 20000 }
存到elasticsearch的數據結構如下
通過logstash輸出到zabbix
logstash配置
配置詳見logstash-output-zabbix
開始我直接配置zabbix_host => "logstash"
時報錯Field referenced by logstash is missing {:level=>:warn}
,查看配置文檔
The field name which holds the Zabbix host name. This can be a sub-field of the @metadata field.
該配置項必須是一個field name,對應了zabbix前端配置的主機名稱。zabbix的配置其實就是zabbix_sender的配置,zabbix_sender的使用見下面
filter { mutate { add_field => { "[@metadata][zabbix_key]" => "logstash" } } } output { if "_grokparsefailure" not in [tags] { if [level] == "ERROR" { zabbix { zabbix_host => "[@metadata][zabbix_key]" zabbix_server_host => "10.24.10.225" zabbix_key => "[@metadata][zabbix_key]" zabbix_value => "message" } } } }
zabbix配置
配置監控項,類型為zabbix采集器
,鍵值對應logstash zabbix配置的zabbix_key
配置完成之后,可以通過zabbix_sender
進行測試
[root@Slave01 ~]# zabbix_sender -z 10.24.10.225 -s logstash -k "logstash" -o hello1111 info from server: "processed: 1; failed: 0; total: 1; seconds spent: 0.000038"
然后在zabbix前端 監測中—>最新數據
里面找到這個值
配置觸發器,選擇區間T中最新字符串的長度
,即有錯誤消息,立馬就進行郵件預警
發送的郵件內容