數據倉庫概念
1.概念模型設計
所要完成的工作是:
(1)界定系統邊界
要做的決策類型有哪些?
決策者感興趣的是什么問題?
這些問題需要什么樣的信息?
要得到這樣信息需要包含原有數據庫哪些數據?
(2)確定主要的主題及其內容:
主題是基於業務來說的,不是技術本身。如果業務能夠按照一定規模分割出獨立的幾個模塊,那每個模塊就是一個主題域。這是分而治之的思想
客戶主題的含義可以簡單給你解釋為以客戶號為主鍵的事實表的集合就是客戶主題;
當中包含了客戶的各方面信息;
數據倉庫是對原有數據庫中數據進行集成和重組而成的集合,看原有數據中"有什么"、“怎樣組織的”、“如何分布的”等,考慮如何建立數據倉庫
數據倉庫步驟
1.確定主題
主題和業務結合,設計數據倉庫之前一定要充分了解業務有哪方面需求,據此確定主題
2.確定度量
確定了主題,考慮要分析的技術指標
3.確定數據粒度
考慮到量度的聚合程度不同,我們將采用“最小粒度原則”,即將量度的粒度設置到最小
4.確定維度
設計各個維度的主鍵、層次、層級、盡量減少冗余
5.創建事實表
事實表中將存在維度代理鍵和各量度,而不應該存在描述性信息,即符合“瘦高原則”,即要求事實表數據條數盡量多(粒度最小),而描述性信息盡量少。