數據倉庫專題(2)-Kimball維度建模四步驟


一、前言

  四步過程維度建模由Kimball提出,可以做為業務梳理、數據梳理后進行多維數據模型設計的指導流程,但是不能作為數據倉庫系統建設的指導流程。本文就相關流程及核心問題進行解讀。

二、數據倉庫建設流程

  以下流程是根據業務系統、組織結構、團隊結構現狀設定的數據倉庫系統建設流程,適合系統結構復雜,團隊協作復雜,人員結構復雜的情況,並且數據倉庫建設團隊和業務系統建設團隊不同的情況。具體流程如下圖所示:

 

圖1 數據倉庫系統建設流程

 

三、四步維度建模

  Kimball四步建模流程適合上述數據倉庫系統建設流程中模型設計環節,重點解決數據粒度、維度設計和事實表設計問題。四步建模流程如下圖所示:

三、流程解讀

  3.1 如何確定粒度

    最細粒度和聚合粒度之爭?留給大家來辯駁吧,大家可以在評論中發表各自的觀點。

  3.1 如何標識維度

    標識維度解決的是業務人員如何描述來自業務過程的數據,維度用來表示“誰、什么、何時、何處、為何、如何”的問題。以競價廣告檢索流程而言就是客戶通過什么渠道、什么樣的客戶端(OS、IP)、檢索了什么樣的內容、請求最終有誰受理等。

  3.2 如何標識事實

    標識事實其實是在確定業務過程的度量指標,指標何來?哪些指標必須保留,那些指標必須刪除,待定指標如何處理?必須綜合考慮業務用戶需求和現實數據的實際情況。事實表的設計完全依賴於物理活動,不受可能產生的最終報表的影響,報表只是事實表設計的參考視角。

四、未完待續

  數據倉庫專題作為項目筆記,持續更新中,敬請關注。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM