1、界面
status:
可以看見apache druid的版本號,現在是0.16.0,里面有9個擴展項
datasource:
監控數據源:我提交了兩次索引服務,所以現在有兩個2個DataSource
segment:
監控segment:里面有9個Segment,每個Datasource由多個segment組成
supervisors:
監控提交的任務:提交索引服務會使用到這個主管,我提交了兩次,所以現在有兩個正在運行
Tasks:
運行的任務監控
servers:
druid上運行的服務監控:1個統治節點、一個協調節點、一個路由節點、一個查詢節點、一個歷史節點、一個中間管理者、2個苦工
Lookups:
Apache Druid(正在孵化)中的一個概念,其中維度值(可選)被新值替代,譬如四川省的編碼為01,能夠通過維度表,可以直接更改為四川省!
eg:
SELECT LOOKUP(column_name, 'lookup-name'), COUNT(*) FROM datasource GROUP BY 1
2、DataSource
Available:
datasource中的那些segment可用
Segment load/drop:
segment的加載和刪除情況,受retention影響
retention:
配置segment的規則,現在上面的規則是:無論何時集群都加載
可以配置
segment的副本數、
通過間隔時間加載:經常用於流處理
通過時間段加載: 經常用於批處理,比如離線數據我們只是加載我們想要的時間段的數據
Compaction:
配置合並規則,用與合並segment
actions:
放大鏡里面是數據列和數據類型
設置里面可以刪除、禁用DataSource
3、segment
Segment ID:
在上一篇博客中說了,由四部分組成:
DataSource 名稱 + segment時間間隔(數據的起始時間 + 數據的結束時間) + 版本號 (此segment的啟動時間) + 分區號
is published:
是否發布:當索引服務將數據生成segment並且寫入到了元數據,那么就是true
is realtime:
如果是由實時任務產生的,那么會為true,但是一段時間之后,也會變為false,所以估計是segment是否存在於實時節點
is available:
如果Segment當前可用於查詢(實時任務或歷史進程),則為true。
is_overshadowed:
標記該段是否已被其他段覆蓋!處於此狀態的段很快就會將其used標志自動設置為false。
4、task
我現在有一個任務運行,他接受kafka的數據,DataSource叫FACT_BA_FYXX2018,每隔一個小時產生一個segment,所以每一個小時會觸發一個task
這並不代表我一個小時之后才能查詢出數據,如果任務沒觸發,但是我們仍然可以從實時節點查詢出數據
5、Servers
6、query