雖然一直在做數據倉庫開發,但是還沒有從0開始搭建過數據倉庫,所以就想通過學習和思考來搭建一個還不錯的數據倉庫。比較經典的當屬Kimball生命周期方法,它為我們在數據倉庫開發過程中提供了路標的作用,生命周期方法的總體結構的核心內容有
- 定義業務需求
- 技術路徑
- 技術架構設計
- 產品的選擇和安裝
- 數據路徑
- 維度建模
- 物理設計
- ETL設計和開發
- BI應用路徑
- BI應用設計
- BI應用開發
后續會按照這個順序依次做些總結和思考。其中第一部分定義業務需求是后面的三種路徑的前提,但是跟數據路徑更加緊密一些,所以就在數據路徑中作總結了。