數據倉庫包含標准化數據。
還包含 外部數據/非結構化數據
如果外部數據 量小 可以保持數據庫內部或者專用服務器。
如果量大 只能記住地址, 在etl 加載
當然也有需求 是實時數據 比如股票 匯率 拿只能etl過程處理
非結構化數據 包含圖片 ,視頻 音頻
如果是傳統數據庫 db2 oracle存在里面是不合適的。存儲影響性能
如果是hadoop 無所謂 影響不大,
但是從使用者的角度
非結構化數據 只能轉換關系使用
建一張元數據表存儲非結構化存儲位置就可以了。
比如說文檔之類 我需要檢索。非結構化數據
建議在應用端使用soli lucnce這些檢索工具
數據倉庫沒來就沒有統計的概念。只是看大家怎么區分的。