一、數倉建模目的
訪問性能:數據快速查詢,減少io
數據成本:減少數據冗余,計算結果服用,降低存儲和計算成本
使用效率:改善用戶應用體驗,提高使用數據效率
數據質量:改善數據統計口徑的不一致,減少數據計算錯誤的可能性,提工高質量、一致的數據訪問平台
二、數倉建模方法
1、維度建模:按照事實表、維表來構建
星型模型:一個事實表+多個維表
雪花模型:一個或多個維表通過維表連接到事實表
星型模型和雪花模型的區別:
查詢性能:在oltp(聯機事務處理)星型模型更占優,在olap(聯機分析處理)雪花模型更占優
模型復雜度:雪花模型更復雜
層次結構:雪花模型層次清晰
存儲:雪花模型不存冗余數據
2、范式建模(三范式建模法)
(1NF) 原子性,數據不可拆分
(2NF) 唯一性,一個表只說明一個事務,所有列依賴於主鍵
(3NF) 每個非主屬性不能依賴於其他關系屬性
3、Data Vault模型
4、Anchor模型