一、先介紹下什么是RFM模型
根據RFM模型,我們現在的目標是尋找那三個指標。
①最近一次消費。這里我們可以將最近一次投資時間與提數日做減法(這里選擇了2016年7月20日為提數日),然后用DATEDIF這個隱形函數來計算“最近一次投資時間距離提數日天數”,記得要+上1.
②消費頻率。用月均投資次數來表示是最好的,計算出月均投資金額,用 總計投標總次數/累計投資月數,
③消費金額。用月均投資金額來表示是最好的,公式是 總計投資總金額/累計投資月數
有了以上三個數后,我們便湊齊RFM三個元素了,但三個元素的量綱需要減少下,可以用Z分數標准化,也可以用LOG(以10為底)來進行減少量綱。這里我用了對數化。
四、利用SPSS進行K-MEANS聚類分析
我們把LOG后的三個元素復制到SPSS上進行聚類分析,如下圖

將三個數據全部載入,聚類數是8,因為RFM是將用戶類型分成八類的

迭代信息不用改,保存信息將兩個選項都勾選上,將選項信息里的統計量全勾選上


確定后可以仔細看看出現的圖表,千萬不要連圖表都不會看就直接將結果復制粘貼了,這樣很危險。不要做工具和模型的奴隸。

這里SPSS選了這八組數作為初始凝聚點
經過迭代后,形成了最終聚類中心,而這些聚類中心將會與其他除聚類中心以外的數據進行類間最小距離與類內最大距離的比較計算
如果數據與某個凝聚中心的距離小於類間最小距離,則兩個數據就合並,取他們的重心作為新的凝聚點,依次迭代下去。

這是方差分析表(ANOVA),這里的方差分析判斷用於聚類的變量是否對於聚類結果有貢獻,方差分析檢驗結果越顯著的變量,說明對聚類結果越有影響。對於不顯著的變量,可以考慮從模型中剔除。這里我們可以看到P值真的很小很小,所以可以判斷有顯著差異。

把主要的幾個表解釋完了,現在可以返回到SPSS的數據表格中查看用戶被分成了哪幾類,我們可以看到:

可以把分類那一列復制到Excel里

搞定后,就要開始對用戶進行具體的分類了。
首先,在根據八大類,對各項指標值進行計算,這里一定要熟悉使用countifs、sumifs等函數,反正不要小看excel的各種小技巧,如$這樣的鎖定鍵。

接下來,我們把八大類的R、F、M、投資金額占比、投資人數占比的數據再列出來,轉置如下,做堆積圖


除此之外,我們還可以畫出以月均投資金額為X值,月均投資次數為Y值,以最后一筆投資距提數日天數為面積畫出氣泡圖

最后根據各項數值,來定義各類用戶的類型,順便做一下圖表的美化。
八類客戶我們可以分成: ①重要價值客戶 ②重要喚回客戶
③重要深耕客戶 ④重要挽留客戶
⑤潛力客戶 ⑥新客戶
⑦一般維持客戶 ⑧流失客戶
最好對活躍度、貢獻度、覆蓋度進行簡單描述。覆蓋度就是看注冊時間和投資時間來比較

總結一下:RFM模型與K聚類相結合並不難,復雜的是對各類指標的理解和掌握。比如說我要怎么從那么多指標里挑出合適的三個指標作為我的R、F、M?對這些指標進行怎么樣的處理才適合進行聚類運算?這些都是十分需要考慮的,不是你懂那個原理,懂那個模型就能解決的事情。還要對實際情況和業務進行深刻地理解,就是要多去實踐,多了解當下的指標和業務,才能做出更好的判斷。另外,還要必須對結果以外的數據做出深刻的解讀,比如聚類分析后出現的方差分析表等等。其實我第一次做這個的時候,也是很多不懂,不懂的地方主要在於對指標的理解,還是問過老師很多次才知道這些指標什么意思,不過主要是自己上網找資料~
