會員數據化運營


本篇為《python數據分析與數據化運營》一書的筆記。

 

1、會員價值度模型——RFM

RFM模型時根據會員最近一次購買時間R,購買頻率F,購買金額M,計算得出RFM得分,通過三個維度來評估客戶的訂單活躍價值。RFM模型基於一個固定的時間點來做模型分析,因此,今天做的RFM得分跟7天前做的結果可能不一樣。

  • R:最后一筆訂單距離現在的時間差,可以用於 R 的定義。需要強調的是結合客戶購買周期來定義 R 的分組問題,例如電視機的購買周期較長(如 300天),分組區間最好大於購買周期,否則客戶價值無法體現;
  • F:定義時間內,購買數量的多少。需要注意的是這里的數量,不一定是總數,也可以是最小值(價值低的客戶)、最大值、中位數(或平均數)、方差等指標,什么指標不重要,重要的是用什么指標反映什么目的。
  • M:定義時內,購買金額的多少。指標同 F

RFM 無法解決的問題:RFM 並不是一個統計模型, 更像一個統計描述,故無法預測目標市場中新用戶的行為特征——購買動機、用戶購買或流失概率、模擬市場占有率。

 

步驟:(1)設置截止時間節點

           (2)得到會員id,訂單數據、訂單金額的原始數據

           (3)從訂單時間中找到各會員距離截止時間最近的訂單時間;以會員id為維度,統計購買頻率,購買金額

   (4)R、F、M做數據分區。對於F、M,值越大,標志購買頻率越高,購買金額越大;對R,值越小表示距離時間節點越近。

           (5)將三個值組合或相加在一起得到總的RFM得分。

#導入庫
import pandas as pd
import numpy as np

#讀入數據
data=pd.read_csv(r'E:\data analysis\test\sales.csv')
print(data.head())

print(data['AMOUNTINFO'].describe()) #查看描述性統計信息
print(data[data.isnull().any(1)])#查看缺失值

#缺失值占比小,直接去掉
sales_data=data.dropna()

#將日期的str類型,變為時間類型
print(sales_data[sales_data.isnull().any(1)])
sales_data['ORDERDATE']=pd.to_datetime(sales_data['ORDERDATE'],format='%Y-%m-%d')
print(sales_data.dtypes) #查看數據類型
#計算r、f、m數值 r=sales_data['ORDERDATE'].groupby(sales_data['USERID']).max() f=sales_data['ORDERID'].groupby(sales_data['USERID']).count() m=sales_data['AMOUNTINFO'].groupby(sales_data['USERID']).sum() #計算rfm得分 date=pd.datetime(2017,1,1) #選定一個時間節點,用於計算該時間節點與其他時間的距離 r_interval=(date-r).dt.days #計算天數 r_score=pd.cut(r_interval,5,labels=[5,4,3,2,1]) #計算得分 f_score=pd.cut(f,5,labels=[1,2,3,4,5]) m_score=pd.cut(m,5,labels=[1,2,3,4,5]) #將rfm得分放在一個數據框中 rfm=pd.DataFrame(np.array([r_score,f_score,m_score]).T,columns=['r_score','f_score','m_score'],index=r_score.index) print(rfm.head()) #合並rfm得分 rfm['rfm_comb']=rfm['r_score'].astype(str)+rfm['f_score'].astype(str)+rfm['m_score'].astype(str) print(rfm.head()) #保存rfm得分 rfm.to_csv(r'E:\data analysis\test\rfm.csv')

 

 2、會員細分模型

(1)ABC分類法

將目標數據倒序排列,然后做累計百分比,A類因素:累計百分比0%~80%,為主要影響因素;B類因素:累計百分比80~90%,為次要影響因素,C類因素:累計百分比90%~100%,為一般影響因素。

例:

(2)聚類法

 具體做法見:用K-Means聚類分析做客戶分群

 

3、會員流失預測模型

做會員流失預測模型的關鍵因素之一是要定義好“流失”,即處在何種狀態,具備哪些特征的會員屬於流失。

會員流失預測模型的實現方法屬於分類算法,常用算法有邏輯回歸、支持向量機、隨機森林等。代碼見:支持向量機、

 

4、會員特征分析模型

會員特征分析模型適用於兩類場景:

一類:沒有任何前期經驗或特定目標,希望通過整體特征分析了解會員全貌。此時,可以通過一定方法先將用戶划分為幾類,然后基於類別的特征分析。

常用方法:(1)聚類,將用戶分為幾個群組,然后再分析不同群組的典型特征和群組間間的差異。

                  (2) 統計分析,將整體用戶做統計分析,包括描述性統計、頻數分布等,了解整體數據概況。

另一類:有明確的業務目標,希望能找到達到事件目標的會員特征,用於進一步的會員運營。

常用方法:(1)分類,利用分類規則例如決策樹找到符合目標的關鍵變量以及對應的變量值,進而確定會員特征。代碼見:構建決策樹

                  (2)關聯,使用關聯規則找到不同屬性、項目間的關聯發生或序列發生關系,然后將會員屬性特征(頻繁項集)提供給運營。

                  (3)異常檢測,使用非監督式的異常檢測方法,從數據中找到異常數據樣本,然后將這些數據樣本特征提供給運營做進一步確認和審查。

 

5、營銷響應預測模型

營銷響應預測模型針對營銷活動展開,通常在做會員營銷活動之前,通過營銷響應預測模型分析找到可能響應活動的會員特征以及整體響應的用戶比例、數量和可能帶來的銷售額。

一般采用分類算法,常用邏輯回歸、支持向量機、隨機森林等。

步驟:(1)隨機選擇一定量的會員樣本(1000條以上)

           (2)針對選擇的會員樣本通過媒介和渠道發送營銷活動信息

           (3)收集營銷活動數據

           (4)通過上述步驟收集到所需樣本集后,通過分類模型做營銷響應預測

營銷響應預測模型的結果一般包括兩個方向:

(1)基於模型找到最可能產生購買轉化行為的會員規則特征。

(2)基於模型預測可能產生的訂單轉化數量、轉化率,以及轉化客戶的客單價大體計算出此次發送會員能得到的營銷收入。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM