1.什么是数据仓库
数据仓库是面向主题的,集成的,和时间有关的,反应历史数据变化的数据集合。是给用户或者业务端提供策略支持的。
2.数据仓库基本特性
- 面向主题性:数据仓库中的数据都是围绕某一主题的
- 数据的集成性:将源数据经过抽取,筛选,清洗,最终集成到数据仓库中
- 数据的时变性:数据随着时间而变化,不断生成主题的新快照
- 数据的非易失性:数据仓库中的数据只进行刷新,不进行更新操作,反应历史变化
3.数据仓库的最终目的是
为用户和业务部门提供决策支持
4.数据库和数据仓库的区别
- 数据库属于业务数据库,存的都是和业务相关的数据,对读写要求高,存储的当前数据
- 数据仓库属于分析型数据库,是为用户提供策略支持的,不要求写的速度有多快,只要求大量数据复杂查询的速度足够快就行,会保留历史数据
5.数据仓库最重要的是什么
数据集成和数据质量:因为数据仓库的最终目的是给用户提供策略支持的,而数据集成主要做的就是整合数据,依靠整合后的数据进行分析提供策略支持的。而且一定要保证数据的准确性