前言
leader 让给生产服务器上 tomcat 错误日志监控起来,我们的应用使用的日志框架是logback
,google 找到了一个 logstash 和logback 集成的好工具,logstash-logback-encoder。
之前流程,客户在使用过程中遇到问题,我们手动的上生产服务器翻看catalina.out
那个时间点的日志来排错。我想实现通过日志监控,将日志按照系统名称、日志类型、日志级别、日志信息、日志堆栈来切割,并输出到 elasticsearch,同时集成了 zabbix,日志信息输出到 elasticsearch 的同时还能同时进行邮件预警,将错误信息直接通过邮件发送。
通过 logstash 输出到 elasticsearch
配置 logback 的 appender,将系统错误日志解析成 json 的格式,并通过 UDP 的方式上传到 logstash,logstash 配置UDP的input,存到 elasticsearch。
logback.xml配置
我使用的是UDP Appender
堆栈信息配置参见Customizing Stack Traces
<appender name="stash" class="net.logstash.logback.appender.LogstashSocketAppender"> <!--logstash服务器IP--> <host>127.0.0.1</host> <!-- port is optional (default value shown) --> <port>514</port> <customFields>{"appname":"bdcor2"}</customFields> <encoder class="net.logstash.logback.encoder.LogstashEncoder"> <throwableConverter class="net.logstash.logback.stacktrace.ShortenedThrowableConverter"> <!--正则匹配的日志信息不输出--> <exclude>sun\.reflect\..*\.invoke.*</exclude> <exclude>net\.sf\.cglib\.proxy\.MethodProxy\.invoke</exclude> <exclude>org.*</exclude> <rootCauseFirst>true</rootCauseFirst> </throwableConverter> </encoder> </appender> <root level="ERROR"> <appender-ref ref="stash"/> </root>
logstash配置
配置Input plugins,默认的bugger_size
是8192,指从网络读取的数据包大小,开始测试的时候,堆栈日志太长,输出到logstash,一直报_jsonparsefailure
,日志信息被截取。
tips: 开启1-1024之间的端口,必须使用root用户
udp { port => 514 codec => "json" type => "syslog" buffer_size => 20000 }
存到elasticsearch的数据结构如下
通过logstash输出到zabbix
logstash配置
配置详见logstash-output-zabbix
开始我直接配置zabbix_host => "logstash"
时报错Field referenced by logstash is missing {:level=>:warn}
,查看配置文档
The field name which holds the Zabbix host name. This can be a sub-field of the @metadata field.
该配置项必须是一个field name,对应了zabbix前端配置的主机名称。zabbix的配置其实就是zabbix_sender的配置,zabbix_sender的使用见下面
filter { mutate { add_field => { "[@metadata][zabbix_key]" => "logstash" } } } output { if "_grokparsefailure" not in [tags] { if [level] == "ERROR" { zabbix { zabbix_host => "[@metadata][zabbix_key]" zabbix_server_host => "10.24.10.225" zabbix_key => "[@metadata][zabbix_key]" zabbix_value => "message" } } } }
zabbix配置
配置监控项,类型为zabbix采集器
,键值对应logstash zabbix配置的zabbix_key
配置完成之后,可以通过zabbix_sender
进行测试
[root@Slave01 ~]# zabbix_sender -z 10.24.10.225 -s logstash -k "logstash" -o hello1111 info from server: "processed: 1; failed: 0; total: 1; seconds spent: 0.000038"
然后在zabbix前端 监测中—>最新数据
里面找到这个值
配置触发器,选择区间T中最新字符串的长度
,即有错误消息,立马就进行邮件预警
发送的邮件内容