大數據之BI開發 - 維度創建


 

 

    用多維數據庫中的點,表示對業務的度量結果。在各種各樣的市場銷售產品,並不斷對企業各類業務的表現進行度量。

 

 

術語匯總結合圖

 

 

 

相關概念

 

  • 事實(表示某個業務度量):用於度量

存儲組織機構業務過程事件的性能度量結果;每一行數據是一個特定級別的細節數據 ;事實表的主鍵,是外鍵集合(組合鍵) 。

 

  • 維度表:用於描述環境

通常有多列,或者說多個屬性 。用於描述與“誰、何時、哪里、為什么、如何、什么”有關的事件 

 

  • 事實表與維度表的連接,遵循簡單和對稱性的原則。

 

 

  • 星型模型雪花模型:根據事實表和維度表的關系
    • 星型模型:

 

    • 雪花模型:

 

 

參考:

  • 大數據查詢系統HiveImpalaSparkSQLKylin
  • 查詢速度與被查詢數據總量之間的關系:給定硬件條件下,假設數據總量為N( 1)查詢時間隨着數據量的增長而線性增長,O(N) ;2)查詢時間不隨數據量增長而增長,O(1) )
  • 大數據查詢相關的關鍵技術:列式存儲;並行計算;內存計算
  • SQL SERVER中ETL工具 - AS:項目中的Cube  https://v.kuaishou.com/bdZ6cy

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM