第53件事 數據監控的4種方法


最近在微信群經常看到公司招聘產品經理,在職位說明中基本上都會要求對運營數據敏感,能夠分析數據的異常情況。看來,各個公司對產品經理的數據分析能力要求越來越高了。也是,產品沒有運營數據,就好像一個人沒有眼睛一樣,產品的調優又從何說起呢?
數據監控主要是對數據的閾值(極限值)進行監控,分析異常原因,並采取相應的措施調優產品。

1.移動均值監控
簡單移動均值(SMA)的計算公式為Xn+1=(X1+X2+X3+…+Xn)/n。相關數據如表7-11所示。

2.環比同比監控
與上一統計段比較,例如2014年7月份與2014年6月份相比較,叫環比。與歷史同時期比較,例如2015年7月份與2014年7月份相比,叫同比。
環比增長率=(本期數-上期數)/上期數×100%;環比增長率反映本期比上期增長了多少。訂單量同比、環比監控數據如表7-12所示。

3.P控制圖
P控制圖適用於比率型數據,如整體轉化率、新用戶比例、活躍用戶比例等。我們以電商網站的轉化率為例,如圖7-16所示。
圖中實線CL指的是中心線,等於均值μ;上面虛線UCL指的是控制上限,等於μ+3σ;下面虛線LCL指的是控制下限,等於μ-3σ。那么到底轉化率曲線在什么情況下會被認為是數據異常?主要有如下情況:

(1).高於控制上限或低於控制下限;
(2).近期的3個點中的2個點都高於+2σ或都低於-2σ,近期5個點中的4個點都高於+σ或都低於-σ(有出現異常的趨勢);
(3).連續的8個點高於中心線或低於中心線(有偏向性) ;
(4).連續的6個點呈上升或下降趨勢(有明顯的偏向趨勢) ;
(5).連續的14個點在中心線上下呈交替狀態(周期性, 不穩定) 。

4.X-MR控制圖
X-MR(單值-移動極差)控制圖適用於數值型數據,如客單價、活躍用戶數等。我們以電商網站的客單價為例,如圖7-17所示。

圖7-17左圖中的上面虛線代表X_UCL,下面虛線代表X_LCL,實線代表X_CL,曲線代表客單價;右圖中上面虛線代表MR_UCL,下面虛線(跟橫坐標幾乎重合)代表MR_LCL,實線代表MR_CL,曲線代表客MR。
其中:
移動極差MR=|X i-X i-1|;
X_CL=客單價的總和/1515是樣本量;
X_UCL=客單價的均值+3×MR的均值/d2=客單價的均值+2.66×MR的均值;
X_LCL=客單價的均值-3×MR的均值/d2=客單價的均值-2.66×MR的均值;
MR_CL=MR的總和/14;
14=樣本量-1;
MR_UCL=D4×MR的均值=3.267×MR的均值;
MR_LCL=D3×MR的均值=0;
公式中的d2、D3、D4是極差到標准差的轉化系數,相當於n=2的極差轉化系數,可以看成固定值。那么到底客單價曲線在什么情況下會被認為是數據異常?主要有如下情況:
(1).高於控制上限或低於控制下限;
(2).連續7點在中心線一側;
(3).連續的7個點上升或下降;
(4).明顯有超出1/3的點落在離控制線很近的區域, 或明顯有少於2/3的點落在1/3的區域。

覺得今天的課有點復雜,消化起來有一定的難度,看來是自己統計學方面的知識和技能欠缺了點兒。要想對數據敏感,基本的數據分析和統計方法還是要掌握並能靈活運用的。


數據監控最大的目的是利用移動均值、同比環比、P控制、X-MR控制圖等方法發現數據的異常情況,作出預警機制,並及時進行原因分析。要求對數據比較敏感,掌握基本的統計學方法並能靈活利用。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM