小白學數據分析------->相關分析在充值與購買失衡分析的應用探索


昨天簡單的說過充值記錄的分析方法,今天介紹一下使用相關分析,說說充值與購買的數據相關分析。在很多類型的游戲中,我們經常會做累計充值活動,然而並不是所有的累計充值活動都做的很好,而且某些類型的游戲不適合頻繁作累計充值活動,究其原因,其中之一就是會造成充值與購買的失衡,通俗的說就是會存在持幣待購的情況,我們希望正常或者良性的循環是充值購買為1:1,這點對於平衡消費,穩定消費結構很重要,當然了實際運營中我們也會面臨很多的突發因素,比如游戲內容調整,游戲數值調整,版本IB刺激等等。但是如果出現持幣待購也就是說充值遠遠大於購買時,我們就需要警惕和分析原因。

但是我們如何來判定和量化持幣待購的情況?這里我們將采用相關分析的方法來解決。所謂相關分析(Correlation Analysis)是考察兩個變量的相互變化的關系程度,與回歸分析不同的是,相關分析的兩個變量地位是平等的,不存在因果關系。相關關系是變量之間保持某種不確定的依存關系,相關分析可以借助散點圖或者諸如相關系數來考察變量間的關聯程度。

變量的相關關系按照兩者的變動分為正相關和負相關,正相關也就是相關系數為正,兩個因素同方向變動,一個增大另一個也增大,而負相關就是相關系數為負,兩個因素按照反方向變動,一個增大另一個卻反而減小。

按照相關的程度來看,相關關系可以分為完全相關、不相關和不完全相關。當一個變量變化完全由另一個變量決定時,這種關系為完全相關;如果彼此互不影響,變量各自獨立,就是不相關;而兩個變量之間關系介於完全相關和不相關之間就是不完全相關。

關於描述相關系數的方法有很多種,這里不再講解,一般而言我們比較關注相關分析按照影響因素(變量)如何確定分析方法,對於我們今天討論的充值購買的相關分析就是雙變量相關分析,即通過計算兩個變量之間的相關系數,對兩個變量之間是否顯著相關做出判斷。另外還有偏相關分析,當出現多個變量時,直接對兩個變量進行相關分析往往不能真實反映二者之間的相關關系,這時就需要用偏相關分析,剔出其他變量的線性影響。最后一種是距離分析,當出現了多個變量而不能每個分析解決時,此時將所有的變量按照一定的標准分類,即聚類分析。

相關分析在Excel和SPSS中均有相關的模塊可用於分析,今天說說在Excel中怎么使用相關分析,在Excel中判斷相關關系的方法有兩種,即散點圖和相關關系分析工具。散點圖這里就不再累述了,簡單說說相關關系分析工具的使用。

首先在Excel中把數據分析模塊調用出來,點擊開始,選擇Excel選項

選擇加載項|分析工具庫|轉到

之后打開如下的對話框,選擇分析工具庫,點擊確定,最后會在數據標簽下出現數據分析的加載項。

隨后選擇數據分析|相關系數,出現相關系數對話框。在輸入區域需要輸入分析數據區域的單元格引用,且引用數據區域必須是兩個或者以上的行或者列的相鄰數據區域。這里我們選取某一月的每名玩家的充值總額和該月相應的購買總額。

分組方式是數據區域是按照行或者列排列,單擊逐行或者逐列。

標志位於第一行/標志位於第一列,如果輸入區域的第一行顯示變量名,選中標志位於第一行,列的形式一樣。如果輸入區域沒有變量,無需選擇。

之后會輸出一個相關分析結果的表格,該表格會把兩個變量的相關系數計算出來,根據計算的系數就能夠了解充值總額和購買總額的相關系數。相關系數一般會呈現兩種結果。

正相關:隨着充值總額的增加,購買總額也增加,此時充值和購買的平衡保持較穩(當然這種分析不是絕對的,不要只限於用這一種方法就斷言充值購買的平衡性,還要結合其他數據來看待,切忌)

負相關:隨着充值的增加,購買反而減少,呈反向變化趨勢,此時為充值購買不平衡的情況出現,可以作為一個參考指標。

p.s.做這種相關分析要注意維度的把握,比如是新登玩家、回流玩家等等,可以更加明確的分析和把握客群特點,因為在APA群體中,發生充值購買失衡不一定是整個的APA群體,不斷地細分APA客群,可以更好地進行分析。進而當我們找到了充值購買失衡最為嚴重的APA群體后,在通過聚類分析、RFM分析等更加深刻描述和分析問題。這是一個系列的過程,相關性的分析只是在第一步把充值購買的失衡問題暴露出來,這只是一種手段,但不是唯一。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM