三個例子,讓你看懂數據倉庫多維數據模型的設計


一、概述

  多維數據模型是最流行的數據倉庫的數據模型,多維數據模型最典型的數據模式包括星型模式、雪花模式和事實星座模式,本文以實例方式展示三者的模式和區別。

二、星型模式(star schema)

  星型模式的核心是一個大的中心表(事實表),一組小的附屬表(維表)。星型模式示例如下所示:

 

三、雪花模式(snowflake schema)

  雪花模式是星型模式的擴展,其中某些維表被規范化,進一步分解到附加表(維表)中。雪花模式示例如下圖所示:

從圖中我們可以看到地址表被進一步細分出了城市(city)維。supplier_type表被進一步細分出來supplier維。

四、事實星座模式(Fact Constellation)或星系模式(galaxy schema)

  數據倉庫由多個主題構成,包含多個事實表,而維表是公共的,可以共享,這種模式可以看做星型模式的匯集,因而稱作星系模式或者事實星座模式。本模式示例如下圖所示:

如上圖所示,事實星座模式包含兩個事實表:sales和shipping,二者共享維表。

五、總結

  事實星座模式是數據倉庫最長使用的數據模式,尤其是企業級數據倉庫(EDW)。這也是數據倉庫區別於數據集市的一個典型的特征,從根本上而言,數據倉庫數據模型的模式更多是為了避免冗余和數據復用,套用現成的模式,是設計數據倉庫最合理的選擇。當然大數據技術體系下,數據倉庫數據模型的設計,還是一個盲點,探索中。

  最近在做大數據技術體系下的數據倉庫模型設計,重溫數據傳統數據倉庫的關鍵技術和數據模型,有感興趣的可以一起討論,共同學習。QQ群: 347018601

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM