問:什么是星型模型?
答:星型架構是一種非正規化的結構,多維數據集的每一個維度都直接與事實表相連接,不存在漸變維度,所以數據有一定的冗余。
問:什么是雪花模型?
答:當有一個或多個維表沒有直接連接到事實表上,而是通過其他維表連接到事實表上時,其圖解就像多個雪花連接在一起,故稱雪花模型。雪花模型是對星型模型的擴展。
問:星型模型與雪花模型有什么優缺點?
答:
- 數據存儲方面:星型架構有數據冗余,反范式化,雪花架構沒有數據冗余。
- 雪花模型在ETL操作,加載數據集市的數據是會比較復雜,因為維度表之間還存在關聯模型,星型就相對簡單很多。
- 雪花模型在維度表、事實表之間的連接很多,因此性能方面會比較低,而星型模型的性能就會比較高。
- 雪花模型更加適合維度分析的場景,星型模型更加適合指標分析的場景。
感悟:
雪花模型在應用系統的表設計(關系型數據庫)中涉及的會比較多,分析系統偏向於(大數據系統的數據庫hadoop)星型模型
雪花模型的耦合度比較高