kimball維度建模(4)-統一數倉層DW與事實表設計

本文轉載自查看原文 2020-11-10 20:59 603 數據建模

為什么要設計數據分層 ——參考《一種通用的數據倉庫分層方法》

　　這是數據倉庫同學在設計數據分層時首先要被挑戰的問題，類似的問題可能會有很多，比如說“為什么要做數據倉庫？”、“為什么要做元數據管理？”、“為什么要做數據質量管理？”。當然，這里我們只聊一下為什么要做設計數據分層。

　　作為一名數據的規划者，我們肯定希望自己的數據能夠有秩序地流轉，數據的整個生命周期能夠清晰明確被設計者和使用者感知到。直觀來講就是數據層次、依賴關系清晰。

　　但是，大多數情況下，我們完成的數據體系卻是依賴復雜、層級混亂的。在不知不覺的情況下，我們可能會做出一套表依賴結構混亂，甚至出現循環依賴的數據體系。

　　因此，我們需要一套行之有效的數據組織和管理方法來讓我們的數據體系更有序，這就是談到的數據分層。數據分層並不能解決所有的數據問題，但是，數據分層卻可以給我們帶來如下的好處：

　　貼源數據層ODS、統一數倉層DW(細分為明細數據層DWD和匯總數據層DWS)、標簽數據層TDM、應用數據層ADS。

　　其中，DW層采用維度建模的思想，包含維度表與事實表。涉及到常用的事實表如下：

　　1）事務事實表-記錄業務事務級別數據（增量更新）

　　2）周期快照事實表-記錄時間周期內的聚集事實或狀態度量（增量更新）

　　3）累計快照事實表-覆蓋一個事務從開始到結束之間所有關鍵事件（全量刷新）

只是形容存在某些事件，沒有可記錄的數字化事實。常用於兩個場景：

1）“關注什么未發生”。如處於銷售狀態但尚未銷售的產品(沒有發生銷售事實)有哪些，需要由促銷范圍事件表產品(無促銷事實)-銷售事實表中已賣出產品。

2）“客戶/代理分配”。銷售經理與客戶分配關系表(有一本書專門講了“關系”)，如尚未產生銷售事實的代理分配有哪些，需要由分配關系-已發生銷售行為的分配關系。

對多個原子粒度事實表進行事務度量匯總、進行簡單的數字化上卷獲得。

將來自多過程的事實打橫，以相同粒度合並放在一個單一的事實表中。難點在於不同的過程事實的公共維度處理。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 數倉建模之維度表設計數倉建模之事務事實表設計案例數倉建模之周期快照事實表設計案例數倉建模之累計快照事實表設計案例數倉建模之聚集型事實表設計案例數倉分層和維度建模及表的簡述 kimball維度建模(3)-維度表技術基礎數倉建設中最常用模型--Kimball維度建模詳解【數據倉庫】|4 維度建模之事實表設計 kimball維度建模(1)-4步驟維度模型設計過程