1.什么是數據倉庫
數據倉庫是面向主題的,集成的,和時間有關的,反應歷史數據變化的數據集合。是給用戶或者業務端提供策略支持的。
2.數據倉庫基本特性
- 面向主題性:數據倉庫中的數據都是圍繞某一主題的
- 數據的集成性:將源數據經過抽取,篩選,清洗,最終集成到數據倉庫中
- 數據的時變性:數據隨着時間而變化,不斷生成主題的新快照
- 數據的非易失性:數據倉庫中的數據只進行刷新,不進行更新操作,反應歷史變化
3.數據倉庫的最終目的是
為用戶和業務部門提供決策支持
4.數據庫和數據倉庫的區別
- 數據庫屬於業務數據庫,存的都是和業務相關的數據,對讀寫要求高,存儲的當前數據
- 數據倉庫屬於分析型數據庫,是為用戶提供策略支持的,不要求寫的速度有多快,只要求大量數據復雜查詢的速度足夠快就行,會保留歷史數據
5.數據倉庫最重要的是什么
數據集成和數據質量:因為數據倉庫的最終目的是給用戶提供策略支持的,而數據集成主要做的就是整合數據,依靠整合后的數據進行分析提供策略支持的。而且一定要保證數據的准確性