Hive建模


Hive建模

1、介紹

Hive作為數據倉庫,同關系型數據庫開發過程類似,都需要先進行建模,所謂建模,就是對表之間指定關系方式。建模在hive中大致分為星型、雪花型和星座型。要對建模深入理解,首先需要對hive數倉中的集中表概念進行界定。hive中的表從形態上分內部表、外部表、桶表、分區表。在數據邏輯上划分為維度表和事實表。維度表等價於我們常說的字典表。事實表就是字典表之外的數據表。

1.1 星型

多張維度表,一張事實表,維度表之間沒有關系。查詢性能要好些,存儲有冗余的。星型模型使用的比較多。

1.2 雪花型

雪花型是星型建模的擴展,維度表之間有關系。存儲減少冗余,查詢性能有損失,需要多級連接。和星型模型的共性就是只有一張是事實表。

1.3 星座型

星座型也是星型模型的擴展,存在多張事實表。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM