數據倉庫之建設流程


一、數據倉庫實施流程:

梳理指標體系:
根據公司實際指標體系,簡單的做下總結

  • 確定數據來源 如哪些業務系統,訂單、商品、庫存、供應商、合作商、采購、營建、資產、運營等系統。
  • 確定各系統的數據體系 如現制商品數、外購商品數、等效商品數、客均商品數、響應時長、超時時長、外送時長、准時率等。
  • 數據域划分
    如用戶域(用戶注冊、用戶消費、用戶留存)、流量域(用戶下載、用戶啟動、用戶使用(頁面訪問、下單、分享、點擊)、用戶下單)、訂單域(訂單、訂單商品、訂單制作、訂單配送、訂單評價)、
    商品域(商品SKU、商品類目、商品配方)、結算域(收入、成本、增值稅)、門店域(門店基礎、門店人員、門店地址)、供應鏈域(門店庫存、倉庫庫存、損耗)
    二、數據倉庫模型設計
  • 數據倉庫整體采用Kimball維度建模的方式,主要有兩點:
    1>、維度建模能夠快速響應業務需求的變化
    2>、可以采用增量的方式進行開發,按數據域進行增量開發
  • 維度表設計規范
    1> 每個拉鏈表生成唯一的代理健,代理健以_key結尾
    2> 每個維表生成一個特殊行,避免事實表數據丟失以及處理遲到維情況
    3> 盡可能的寬(反規范化)、包括可能的維度屬性,減少關聯並且保證一致性
    4> 維表屬性划分按照自然屬性進行划分,即屬性不需要通過事實表進行建立關系的應放在同一個維表中
  • 事實表設計規范
    1> 將每個業務過程用獨立的事實表來存放
    2> 將常用的維度采用退化維保留在事實表中
    3> 盡可能保留最細粒度的事實數據
    4> 盡量將不可加事實拆分成可加事實事實表划分依據:
  • 事實表划分依據
    a、事實是否同時發生
    b、事實表的粒度是否相同


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM