https://zhuanlan.zhihu.com/p/100070260
商業數據分析通常都可以簡化為對數據進行篩選、分組、匯總的過程,本文通過一個實例來看看PowerBI是如何快速完成整個過程的。
假設數據為一個訂單明細表,含有下單日期、客戶名稱、產品名稱等數據,業務需求為:
根據訂單表,計算出截止某個日期,購買次數為1-7次、8-14次、14-21次……的客戶分別有多少?
下面是PowerBI解決這個問題的過程,只需要簡單的3個步驟。
1、數據建模
根據訂單表提取出客戶表,以及建立一個涵蓋所有訂單日期的日期表,分別與訂單表建立一對多的關系。
因為要進行分組,所以還要建一個分組表,可以在PowerBI中"輸入數據",手工建一個,數據如下:
這個表不要與其他表建立關系,數據模型如下:
2、建立度量值
建立一個[客戶購買次數]的度量值,如下圖:
這個度量值中體現了篩選、分組和匯總的整個計算,值得你好好練習研究一下。
3,數據呈現
將這個度量值放入到矩陣中計算結果,
從這里可以看出購買15-21次的客戶最多。
可以通過切片器選擇任意一個日期查看,
還可以通過圖表查看每個訂單日期的客戶累計購買次數分布,
通過這個面積圖,可以明顯看出隨着時間的推移,客戶的復購次數越來越多。
通過堆積面積圖來看,雖然客戶的重復下單次數在增加,但總客戶數近一年來停止增長,值得關注。
這樣就完成了任意一個日期的客戶累計下單次數的分組統計,是不是很高效。
以上也是PowerBI數據分析的一個基本流程,從數據建模、DAX的運用到數據呈現,用戶最終看到的只是最后一步:數據呈現,你也許覺得最重要的是第二步,寫出那個度量值,從難度上來說,這確實需要一定的積累。
但更關鍵的其實是第一步,建立模型是數據分析的基礎,一個良好的模型可以更簡單的完成數據分析的需要,也會讓度量值的編寫變得簡潔高效,而糟糕的數據模型,可能你壓根無法寫出可以實現需求的度量值。
關於數據建模,更需要不斷的積累,你不僅要學會分析技術,更要精深業務,每個人都會建立數據模型,但並不意味着你會建立一個良好的模型,數據建模是一門科學,也是一門藝術。