1. 主題性
數據倉庫是一般從用戶實際需求出發,將不同平台的數據源按設定主題進行划分整合,與傳統的面向事務的操作型數據庫不同,具有較高的抽象性。面向主題的數據組織方式,就是在較高層次對分析對象數據的一個完整、統一並一致的描述,能完整及統一地刻畫各個分析對象所涉及的有關企業的各項數據,以及數據之間的聯系。
2.集成性
數據倉庫中存儲的數據大部分來源於傳統的數據庫,但並不是將原有數據簡單的直接導入,而是需要進行預處理。這是因為事務型數據中的數據一般都是有噪聲的、不完整的和數據形式不統一的。這些“臟數據”的直接導入將對在數據倉庫基礎上進行的數據挖掘造成混亂。“臟數據”在進入數據倉庫之前必須經過抽取、清洗、轉換才能生成從面向事務轉而面向主題的數據集合。數據集成是數據倉庫建設中最重要,也是最為復雜的一步。
3.穩定性
數據倉庫中的數據主要為決策者分析提供數據依據。決策依據的數據是不允許進行修改的。即數據保存到數據倉庫后,用戶僅能通過分析工具進行查詢和分析,而不能修改。數據的更新升級主要都在數據集成環節完成,過期的數據將在數據倉庫中直接篩除。
4.動態性
數據倉庫數據會隨時間變化而定期更新,不可更新是針對應用而言,即用戶分析處理時不更新數據。每隔一段固定的時間間隔后,抽取運行數據庫系統中產生的數據,轉換后集成到數據倉庫中。隨着時間的變化,數據以更高的綜合層次被不斷綜合,以適應趨勢分析的要求。當數據超過數據倉庫的存儲期限,或對分析無用時,從數據倉庫中刪除這些數據。關於數據倉庫的結構和維護信息保存在數據倉庫的元數據(Metadata)中,數據倉庫維護工作由系統根據其中的定義自動進行或由系統管理員定期維護。