DataHub使用小結(一)——概述


一、概念

  1.什么是DataHub

    DataHub是流式數據(Streaming Data)的處理平台,提供對流式數據的發布(Publish),訂閱(Subscribe)和分發功能

      在訂閱-發布功能中,訂閱者訂閱自己感興趣的數據,發布者發布到中間channel,發布-訂閱彼此不知道對方的存在

    

 

 

 

 

    可以輕松構建基於流式數據的分析和應用。

    主要可以進行流處理應用以及流數據歸檔(歸檔到maxcomputer)

    參考實踐:https://yq.aliyun.com/articles/61766?spm=5176.11065265.1996646101.searchclickresult.60eb1d87Qu3teG&aly_as=oSSLfdDT

  2.基本概念

    Project:項目,一個項目包含多個topic,是DataHub數據組成的基本單位

    Topic:主題,數據分發的基本單位,用來表示一類數據(類似表),相應的有Topic Lifecycle表示topic的生命周期

    Shard:數據傳輸通道,每個shard都有自己的ID,並且會占用服務端資源,按需使用

    Recode:數據傳輸的基本單位

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM