2、apache druid界面說明


1、界面

  

    status:

        可以看見apache druid的版本號,現在是0.16.0,里面有9個擴展項

   datasource:

        監控數據源:我提交了兩次索引服務,所以現在有兩個2個DataSource

   segment:

        監控segment:里面有9個Segment,每個Datasource由多個segment組成

     supervisors:

        監控提交的任務:提交索引服務會使用到這個主管,我提交了兩次,所以現在有兩個正在運行

     Tasks:

        運行的任務監控

   servers:

        druid上運行的服務監控:1個統治節點、一個協調節點、一個路由節點、一個查詢節點、一個歷史節點、一個中間管理者、2個苦工 

   Lookups:

        Apache Druid(正在孵化)中的一個概念,其中維度值(可選)被新值替代,譬如四川省的編碼為01,能夠通過維度表,可以直接更改為四川省!

        eg:

          SELECT LOOKUP(column_name, 'lookup-name'), COUNT(*) FROM datasource GROUP BY 1

2、DataSource

  

  Available:

              datasource中的那些segment可用

  Segment load/drop:

              segment的加載和刪除情況,受retention影響

  retention:

              配置segment的規則,現在上面的規則是:無論何時集群都加載

              

 

              可以配置

                  segment的副本數、

                  通過間隔時間加載:經常用於流處理

                  通過時間段加載:  經常用於批處理,比如離線數據我們只是加載我們想要的時間段的數據

  Compaction:

        配置合並規則,用與合並segment

  actions:

        放大鏡里面是數據列和數據類型

        設置里面可以刪除、禁用DataSource

 3、segment

  

  Segment ID:

 

      在上一篇博客中說了,由四部分組成:

      DataSource 名稱 + segment時間間隔(數據的起始時間 + 數據的結束時間) + 版本號 (此segment的啟動時間) + 分區號

      

 

  is published:

      是否發布:當索引服務將數據生成segment並且寫入到了元數據,那么就是true

  is realtime:

      如果是由實時任務產生的,那么會為true,但是一段時間之后,也會變為false,所以估計是segment是否存在於實時節點

  is available:

      如果Segment當前可用於查詢(實時任務或歷史進程),則為true。

  is_overshadowed:

      標記該段是否已被其他段覆蓋!處於此狀態的段很快就會將其used標志自動設置為false。

4、task

  

  我現在有一個任務運行,他接受kafka的數據,DataSource叫FACT_BA_FYXX2018,每隔一個小時產生一個segment,所以每一個小時會觸發一個task

  這並不代表我一個小時之后才能查詢出數據,如果任務沒觸發,但是我們仍然可以從實時節點查詢出數據

5、Servers

  

6、query

  

 

 

 

  

  

 

 

 

 

 

 

  

 

 

  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM