- 范式建模
- Inmon提出的集線器的自上而下(EDW-DM)的數據倉庫架構。操作型或事務型系統的數據源,通過ETL抽取轉換和加載到數據倉庫的ODS層,然后通過ODS的數據建設原子數據的數據倉庫EDW,EDW不是多維格式的,不方便上層應用做數據分析,所以需要通過匯總建設成多維格式的數據集市層。優勢:易於維護,高度集成;劣勢:結構死板,部署周期較長
- 范式建模應用在EDW層
- 一個符合第三范式的關系必須具有以下三個條件:
1. 每個屬性的值唯一,不具有多義性;
2. 每個非主屬性必須完全依賴於整個主鍵,而非主鍵的一部分;
3. 每個非主屬性不能依賴於其他關系中的屬性,因為這樣的話,這種屬性應該歸到其他關系中去。 - 但是由於EDW的數據是原子粒度的,數據量比較大,完全規范的3范式在數據的交互的時候效率比較低下,所以通常會根據實際情況在事實表上做一些冗余,減少過多的數據交互。
- 維度建模
- Kimball提出的總線式的自下而上(DM-DW)的數據倉庫架構。同樣的,操作型或事務型系統的數據源,通過ETL抽取轉換和加載到數據倉庫的ODS層,然后通過ODS的數據,利用維度建模方法建設一致維度的數據集市。通過一致性維度可以將數據集市聯系在一起,由所有的數據集市組成數據倉庫。優勢:構建迅速,最快的看到投資回報率,敏捷靈活;劣勢:作為企業資源不太好維護,結構復雜,數據集市集成困難。
- 星型模型(推薦)和雪花模型
在復合式的數據倉庫架構中,操作型或事務型系統的數據源,通過ETL抽取轉換和加載到數據倉庫的ODS層,然后通過ODS的數據,利用范式建模方法,建設原子數據的數據倉庫EDW,然后基於EDW,利用維度建模方法建設數據集市。