數據倉庫


1.什么是數據倉庫

數據倉庫是面向主題的,集成的,和時間有關的,反應歷史數據變化的數據集合。是給用戶或者業務端提供策略支持的。

2.數據倉庫基本特性

  • 面向主題性:數據倉庫中的數據都是圍繞某一主題的
  • 數據的集成性:將源數據經過抽取,篩選,清洗,最終集成到數據倉庫中
  • 數據的時變性:數據隨着時間而變化,不斷生成主題的新快照
  • 數據的非易失性:數據倉庫中的數據只進行刷新,不進行更新操作,反應歷史變化

3.數據倉庫的最終目的是

為用戶和業務部門提供決策支持

4.數據庫和數據倉庫的區別

  • 數據庫屬於業務數據庫,存的都是和業務相關的數據,對讀寫要求高,存儲的當前數據
  • 數據倉庫屬於分析型數據庫,是為用戶提供策略支持的,不要求寫的速度有多快,只要求大量數據復雜查詢的速度足夠快就行,會保留歷史數據

5.數據倉庫最重要的是什么

數據集成和數據質量:因為數據倉庫的最終目的是給用戶提供策略支持的,而數據集成主要做的就是整合數據,依靠整合后的數據進行分析提供策略支持的。而且一定要保證數據的准確性


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM