數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrate)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用於支持管理決策。
(1) 面向主題:指數據倉庫中的數據是按照一定的主題域進行組織。
(2)集成:指對原有分散的數據庫數據經過系統加工, 整理得到的消除源數據中的不一致性。
(3)相對穩定:指一旦某個數據進入數據倉庫以后只需要定期的加載、刷新。
(4)反映歷史變化:指通過這些信息,對企業的發展歷程和未來趨勢做出定量分析預測。
主要區別在於:
(1)數據庫是面向事務的設計,數據倉庫是面向主題設計的。
(2)數據庫一般存儲在線交易數據,數據倉庫存儲的一般是歷史數據。
(3)數據庫設計是盡量避免冗余,數據倉庫在設計是有意引入冗余。
(4)數據庫是為捕獲數據而設計,數據倉庫是為分析數據而設計。