Hive建模
1、介紹
Hive作為數據倉庫,同關系型數據庫開發過程類似,都需要先進行建模,所謂建模,就是對表之間指定關系方式。建模在hive中大致分為星型、雪花型和星座型。要對建模深入理解,首先需要對hive數倉中的集中表概念進行界定。hive中的表從形態上分內部表、外部表、桶表、分區表。在數據邏輯上划分為維度表和事實表。維度表等價於我們常說的字典表。事實表就是字典表之外的數據表。
1.1 星型
多張維度表,一張事實表,維度表之間沒有關系。查詢性能要好些,存儲有冗余的。星型模型使用的比較多。
1.2 雪花型
雪花型是星型建模的擴展,維度表之間有關系。存儲減少冗余,查詢性能有損失,需要多級連接。和星型模型的共性就是只有一張是事實表。
1.3 星座型
星座型也是星型模型的擴展,存在多張事實表。