分析思維 第三篇:數據分析的三板斧


令狐沖在華山學藝時,雖然勤學苦練,但是終不得法,在機緣巧合之下,得到風清揚老前輩的真傳,練成獨孤九劍之后,才名震江湖。雖然笑傲江湖的故事情節是虛構的,但從令狐沖蛻變的過程可以看出,練武需要秘籍。數據分析也有一本傳世秘籍,只有六字,這就是《數據化管理》中提到的六字箴言、數據分析的三板斧:對比、細分、溯源,具體來說:

  • (1)對比就是成對的比較,分為橫向對比和縱向對比,橫比是指和“他人”比較,比如,兩家公司的離職率;縱比是指按照時間維度,和“自己”比較,比如,一家公司去年和今天的離職率。
  • (2)細分是指分維度、降低粒度來分析數據,分維度是指增加維度,比如,離職率按照部門維度來分析;降低粒度是指降低數據聚合的程度,比如,離職率不按年份,而按照月份來統計。
  • (3)溯源是指在對比、細分鎖定到具體維度和粒度之后,依然沒有結論,那就需要查看原始數據,洞察數據,從數據中尋找靈感。

無對比,不分析

數據放在那里,是沒有意義的,只有比較起來,才體現出數據分析的價值。無對比,不分析,對比在數據分析中地位,不言而喻。對比其實很簡單,就是把A和B比較,但是,沒有可對比性的對比一定是耍流氓。數據沒有可對比性,就沒有數據分析。指標的可對比性,可以從四個“一致”原則來評估:

  • 對象一致:比較的對象一致
  • 時間屬性一致:指標的時間屬性一致
  • 定義和算法一致:對分析對象的定義和計算方法一致
  • 數據源一致:統計的數據樣本一致

有時,指標的值不重要,是否具有可比性才是關鍵,這四個一致性原則分別是指:

1. 對象一致是可比的最基本原則,番茄的銷量和豬的銷量是不可比的,這其實就是因為比較的對象不一致。

2. 時間屬性比較特殊,對象所在的季節、月份等時間屬性要有可比性,例如,一家便利店冬季雪糕的銷量,和夏季沒有可比性,因為對象的時間屬性不同,但做銷量的同比是可以的。

3. 對象的定義和算法要一致,舉個例子,青年的定義:

  • 中國國家統計局:15-34周歲
  • 中國共青團:14-28周歲

當統計青年人數占總人數的比例時,中國國家統計局和中國共青團的做出的指標,肯定是不同的。

4. 所作的分析中,數據源不同,數據的可比性就會大打折扣。

 

在做對比分析時,要記住三個“要”:對比要可比、差異要顯著、描述要全面。

  • 對比要可比:對比分析要有可比性
  • 差異要顯著:組間差異要顯著,組內差異要細微,常用的顯著性檢驗有T檢驗和方差分析;
  • 描述要全面:當刻畫一組數據時,不僅要描述這組數據的一般水平(均值),還要考慮到這組數據的波動水平。如果波動很大,一般水平對數據總體的代表性就會很差。只考慮一般水平而不考慮波動和差異,會使數據的可信度大大縮水。

 

細分,增加分析的深度

細分體現在增加維度和降低粒度上。一個維度是數據表的一列,通常情況下,維度是指定性數據,例如,產品提供的服務的類型、用戶分布的地域等。在分析數據時,增加分析的維度,改變看待問題的視角,能夠在更細分的級別上分析數據,洞察到更多的知識,增加數據分析的深度。例如,新用戶的留存率,通過增加獲客來源的維度,可以監控各個來源的新用戶的留存率,把有限的經費使用到真正可以帶來有效轉化的地方。

粒度是數據的聚合程度,最細節的數據是不會聚合的原始數據。舉個例子,每日數據是原始數據,其粒度是日,數據的數量巨大,而每周的統計數據是對日數據的聚合,其粒度是周,數據的數量變成原來的1/7。

通過增加維度和降低粒度來細分數據,深挖數據,揭示數據中潛藏的規律。

 

溯源,從原始數據中獲得洞察

溯源,就是到細節數據中去,查看原始數據,反思用戶的行為。在做數據分析時,一定要明白你分析得數據是二手的,還是一手的。一手數據是最原始的數據,包含的內容最豐富,但數據可能不規范。二手數據是經過處理的,甚至是分析之后的數據,這些數據可能是片面的、閹割的、面向特定主題的。由此得出的分析結果可能有失偏駁。

 

數據分析方法

基本的數據分析方法,主要有以下4個,每一個方法都包含非常豐富的內容,下面簡單介紹它們的顯著特征。

1. 對比分析

對比分析中,通常以時間和空間兩個維度選擇參照物,自我比較,從“歷史”到“現在”,形成時間序列,叫做縱向對比;時間屬性相同,與別的事物比較,空間不同,叫做橫向對比。

2. 分類分析

研究對象通常是由不同的分組,每個分組的屬性可能是不同的,一個分組也叫一個類別。如果能把所有的個體按照其特點和屬性分類,使類內的差異小、具有共性;使類間的差異大、具有個性,那么分析的工作就是面向這幾個類別,而不是大量的個體。分類分析的價值就是用類別代替個體,找到個性所在。

3. 分布分析

當對比的對象不是一個數值,而是一組數據值時,需要考察數據的集中和離散趨勢。

4. 相關分析

相關分析研究的是事物之間的聯系,相關分析的價值,在於把關聯量化。發現相關性可以幫助你預測未來,而發現因果關系意味着你可以改變世界。

 

參考文檔:

“對比,細分,溯源”@caoz


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM