一、數據倉庫實施流程:
梳理指標體系:
根據公司實際指標體系,簡單的做下總結
- 確定數據來源 如哪些業務系統,訂單、商品、庫存、供應商、合作商、采購、營建、資產、運營等系統。
- 確定各系統的數據體系 如現制商品數、外購商品數、等效商品數、客均商品數、響應時長、超時時長、外送時長、准時率等。
- 數據域划分
如用戶域(用戶注冊、用戶消費、用戶留存)、流量域(用戶下載、用戶啟動、用戶使用(頁面訪問、下單、分享、點擊)、用戶下單)、訂單域(訂單、訂單商品、訂單制作、訂單配送、訂單評價)、
商品域(商品SKU、商品類目、商品配方)、結算域(收入、成本、增值稅)、門店域(門店基礎、門店人員、門店地址)、供應鏈域(門店庫存、倉庫庫存、損耗)
二、數據倉庫模型設計
- 數據倉庫整體采用Kimball維度建模的方式,主要有兩點:
1>、維度建模能夠快速響應業務需求的變化
2>、可以采用增量的方式進行開發,按數據域進行增量開發 - 維度表設計規范
1> 每個拉鏈表生成唯一的代理健,代理健以_key結尾
2> 每個維表生成一個特殊行,避免事實表數據丟失以及處理遲到維情況
3> 盡可能的寬(反規范化)、包括可能的維度屬性,減少關聯並且保證一致性
4> 維表屬性划分按照自然屬性進行划分,即屬性不需要通過事實表進行建立關系的應放在同一個維表中 - 事實表設計規范
1> 將每個業務過程用獨立的事實表來存放
2> 將常用的維度采用退化維保留在事實表中
3> 盡可能保留最細粒度的事實數據
4> 盡量將不可加事實拆分成可加事實事實表划分依據: - 事實表划分依據
a、事實是否同時發生
b、事實表的粒度是否相同