第一步:選擇業務過程
1、通過對業務需求以及可用數據源的綜合考慮,確定對哪種業務過程開展建模工作
2、建立的第一個維度模型應該是一個最有影響的模型——它應該對最緊迫的業務問題作出回答,並且對數據的抽取來說是最容易的。
第二步:定義粒度
注:粒度是指數據倉庫的數據單位中保存數據的細化或綜合程度的級別,細化程度越高,粒度就越小
1、應該先優先考慮為業務處理獲取最有原子性的信息而開發維度模型。原子型數據是所收集的最詳細的信息,這樣的數據不能再做更進一步的細分。
2、數據倉庫幾乎總是要求在每個維度可能得到的最低粒度上對數據進行表示的原因,並不是因為查詢想看到每個低層次的行,而是因為查詢希望以很精確的方式對細節知識進行抽取。
第三步:選定維度
一個經過仔細考慮的粒度定義確定了事實表的基本維度特性。同時,經常也可能向事實表的基本粒度加入更多的維度,而這些附加的維度會在基本維度的每個組合值方面自然地取得唯一的值。如果附加的維度因為導致生成另外的事實行而違背了這個基本的粒度定義,那么必須對粒度定義進行修改以適應這個維度的情景。
第四步:確定事實
確定將哪些事實放到事實表中。粒度聲明有助於穩定相關的考慮。事實必須與粒度吻合。在考慮可能存在的事實時,可能會發現仍然需要調整早期的粒度聲明和維度選擇
維度建模的優缺點:更好的應對業務變化,數據冗余多,占空間多,就是用空間換時間。