之前介紹filter date插件時就談到時區問題,但是沒有說明白。最近在使用range查詢時間范圍內的數據時出現了數據量不一致的情況。特地了解了下ELK Stack中關於時區的問題。
問題:
使用kibana discovery界面搜索時,數據量一致。使用curl 搜索時少了數據。
再說時間問題前,簡單了解下UTC:
UTC(Universal Time Coordinated) 叫做世界統一時間,中國大陸和 UTC 的時差是 + 8 ,也就是 UTC+8。
UTC時區參考文檔
查看官方文檔后得到的結論:
ELK Stack集群各服務對時間處理的介紹:
logstash :根據所在機器的時區並對date類型數據進行處理,整理成UTC時間
elastic :所有date類型數據都存儲為GMT(毫秒級)
kibana :根據kibana配置的時區,從elastic取出的timestamp時間轉換為相應時區的時間。
問題原因:
logstash處理后以UTC時間存儲進elastic,kibana取出來后,在恢復成相應時區的時間。因為我機器都是CST的時間,所以使用kibana搜索沒有問題,但是curl命令不會對所取出來的時間進行時區轉換,所以就少了8小時數據。
解決方法:
一:
logstash 過濾字段信息時,刪除或分開匹配時間和時區信息,timestamp
只匹配具體時間,timezone
則匹配+0800
這樣的時區信息,並同時定義timezone為UTC,這樣從根本上就得到原始的時間。
UTC時間的示例:
$ bin/logstash -f text.conf
[26/Mar/2019:00:00:08 +0800] #這里以nginx日志中的時間為例
{
"timestamp" => "26/Mar/2019:00:00:08",
"message" => "[26/Mar/2019:00:00:08 +0800]",
"@timestamp" => 2019-03-26T00:00:08.000Z, #@timestamp的時間和輸入的時間一致
"@version" => "1",
"timezone" => "+0800",
"host" => "node2007"
}
$ cat text.conf
input {
stdin {}
}
filter {
grok {
match => {
"message" => "\[%{NOTSPACE:timestamp} %{INT:timezone}\]"
}
}
date {
match => [ "timestamp", "dd/MMM/yyyy:HH:mm:ss" ]
timezone => "UTC" #無法從timestamp中提取時區。設置時區為UTC時間,忽略系統時區,如果date插件中的match匹配到了時區,則此處的時區不生效。所以在grok插件中將timezone和timestamp分隔開
}
}
output {
stdout{
codec => rubydebug
}
}
正常時間處理:
$ bin/logstash -f text.conf
[26/Mar/2019:00:00:08 +0800]
{
"@version" => "1",
"@timestamp" => 2019-03-25T16:00:08.000Z, #轉換成UTC時間,減少8小時,
"message" => "[26/Mar/2019:00:00:08 +0800]",
"host" => "node2007",
"timestamp" => "26/Mar/2019:00:00:08 +0800"
}
$ cat text.conf
input {
stdin {}
}
filter {
grok {
match => {
"message" => "\[%{HTTPDATE:timestamp}\]"
}
}
date {
match => [ "timestamp", "dd/MMM/yyyy:HH:mm:ss Z" ]
timezone => "UTC"
}
}
output {
stdout{
codec => rubydebug
}
}
系統日志中不帶有時區信息,則可以直接在配置文件中指定timezone => "UTC"
即可。無需要做匹配工作。
二:
匹配到時區時間沒有關系,可以在過濾時,在把時間補回來。
...
date {
match => [ "timestamp", "dd/MMM/yyyy:HH:mm:ss Z" ]
target => "time"
}
ruby {
code => "event.set('timestamp', event.get('time').time.localtime + 8*60*60)" #處理時將logstash自動減少的時間在給加回來
}
ruby {
code => "event.set('@timestamp',event.get('timestamp'))"
}
...
以上代碼經過我測試,可以正常使用。這里使用ruby插件,我不懂,time -> timestamp -> @timestamp需要經由兩個變量才能最后賦值給@timestamp,為什么不能直接使用@timestamp處理並賦值,如果有懂得的人,還請留言告知。
對時間進行處理后,我們可以使用curl命令隨意進行查詢啦,但是使用kibana時,還需要設置一下默認的時區: Management -> kibana(高級設置) -> Timezone for date formatting 並選擇UTC時間展示。 
總結:
ELK Stack一整套組合拳的時區特性特別好用,但是在國內還是統一時區吧。統一時區還是再數據存儲前做調整,否則后期查詢會流淚的。