事實表的三種類型


維度建模中,事實表分為三類:事務事實表,周期快照事實表,累計事實表,他們維度一致,但功能要求和描述的業務事實存在巨大差異。

1. 事務事實表

事務事實表記錄事務層面的事實,保存最為原子的數據,其數據在事務發生后發生,粒度為每一行數據。其一旦提交不能修改,增量更新。

事實表一般圍繞着度量來建立,當度量產生的時候,事實記錄就生成了。度量可以是銷售數量、交易流水值、月末節余等數值。一般會根據數據度量以及提前規定好的一致性維度來進行統計等工作。

事務的數字度量分為三種:

1)可加事實

可加事實指的是該度量可以按照和事實表關聯的任一維度進行匯總。比如商品的單價,可以按照品類維度進行匯總,按照店鋪維度進行匯總等等。

2)半可加事實

指的就是該度量在某些維度下不可進行匯總,或者說匯總起來沒有意義,比如說價差額,價差額在時間維度下的匯總就沒有意義。

3)不可加事實

指的是該度量在所有與該事實表關聯的維度下都不可進行匯總,比如說比率型數據

2.周期快照事實

周期快照表以具有規律性、可預見時間的記錄事實,它統計的是間隔周期內的度量統計,如歷史至今、自然年至今、季度至今等等其更新方式同事務事實表,采用增量更新

周期快照事實表粒度是每個時間段一條記錄,通常比事務事實表的粒度要粗,是在事務事實表之上建立的聚集表,維度比事務事實表要小,但記錄的事實比事務事實表更多,事務事實表是稀疏表,周期快照表是稠密表。

1)什么是稀疏表,什么是稠密表?

  稀疏表:當天只有發生了操作才會有記錄

  稠密表:當天沒有操作也會有記錄,便於下游使用

事務事實表是 稀疏的,只有當天發生的業務過程,事實表才會記錄該業務過程的事 實, 如下單、支付等;而快照事實表是稠密的,無論當天是否有業務過程發 生,都會記錄一行,比如針對賣家的歷史至今的下單和支付金額,無論 當天賣家是否有下單支付事實,都會給該賣家記錄一行

就比如用戶周一下單3單,周二沒有下單,但系統仍在周二分區里記錄該周下單3單。

3.累計快照事實表

積累快照事實表與周期快照事實表比較相似,都是存儲事務數據的快照相信,但后者積累確定周期的數據,而積累積累不確定周期的數據,其可能覆蓋一個完整的事務或產品的生命周期,通常有多個日期字段,記錄生命周期的關鍵時間點,比如訂單記錄快照事實表有付款日期,發貨日期和收貨日期時間點。

周期快照事實表記錄重復的可預測到的時間間隔事實,例如賬號月余結事實表,而記錄快照事實表適合較短周期,有明確開始時間和結束狀態時間,中間記錄每個步驟的執行時間,使得分析人員對整體過程有所把握。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM