維度建模過程

本文轉載自查看原文 2020-08-18 14:37 542 面試

1、通過對業務需求以及可用數據源的綜合考慮，確定對哪種業務過程開展建模工作

2、建立的第一個維度模型應該是一個最有影響的模型——它應該對最緊迫的業務問題作出回答，並且對數據的抽取來說是最容易的。

注：粒度是指數據倉庫的數據單位中保存數據的細化或綜合程度的級別，細化程度越高，粒度就越小

1、應該先優先考慮為業務處理獲取最有原子性的信息而開發維度模型。原子型數據是所收集的最詳細的信息，這樣的數據不能再做更進一步的細分。

2、數據倉庫幾乎總是要求在每個維度可能得到的最低粒度上對數據進行表示的原因，並不是因為查詢想看到每個低層次的行，而是因為查詢希望以很精確的方式對細節知識進行抽取。

一個經過仔細考慮的粒度定義確定了事實表的基本維度特性。同時，經常也可能向事實表的基本粒度加入更多的維度，而這些附加的維度會在基本維度的每個組合值方面自然地取得唯一的值。如果附加的維度因為導致生成另外的事實行而違背了這個基本的粒度定義，那么必須對粒度定義進行修改以適應這個維度的情景。

確定將哪些事實放到事實表中。粒度聲明有助於穩定相關的考慮。事實必須與粒度吻合。在考慮可能存在的事實時，可能會發現仍然需要調整早期的粒度聲明和維度選擇

維度建模的優缺點：更好的應對業務變化，數據冗余多，占空間多，就是用空間換時間。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【數據倉庫】|5 維度建模設計和實施過程維度建模—維度表設計維度建模的基本原則數據倉庫與維度建模用例建模的基本過程大數據開發實戰：維度建模1-相關概念 kimball維度建模技術概述 --《數據倉庫工具箱》數據倉庫工具箱維度建模權威指南第3版.pdf 數據倉庫專題（2）-Kimball維度建模四步驟 kimball維度建模(4)-統一數倉層DW與事實表設計