PS.圖片可能不清楚,代碼 數據集都在 https://github.com/xubin97/Data-Mining_exp1
項目介紹:
本案例的目標是客戶價值識別,通過航空公司客戶數據識別不同價值的客戶。識別客戶價值應用最廣泛的模型是通過3個指標(最近消費時間間隔、消費頻帶和消費金額)來進行客戶細分,識別出高價值的客戶,簡稱REFM 。
在RFM模型中,消費金額表示在一段時間內, 客戶購買該企業產品金額的總和由於航空票價受到運輸距離、艙位等級等多種因素影響,同樣消費金額的不同旅名對航空公司的價值是不同的。例如,一位購買長航線、低等級艙位票的旅各與一位購買短航線、高等級驗位票的旅客相比,后者對於航空公司而言價值可能更高。因此,這個指標並不適用於航空公司的客戶價值分析151我們選擇客戶在一定時間內累積的飛行里程M和客戶在一定時間內乘坐艙位所對應的折扣系數的平均值兩個指標代替消費金額。此外,考慮航空公司會員人會時間的長短在定程度上能夠影響客戶價值,所以在模型中增加客戶關系長度L.作煙區分客戶的另一指標。
本案例將客戶 關系長度、消費時間間隔、消費頻率、飛行里程和折扣系數的平均值五個指標作為航空公司識別客戶價值指標
數據探索
數據預處理
1.數據清洗
2.屬性規約
3.數據轉換
模型構建
特征分析
用雷達圖進行分析
結果:
價值分析 特征分析
Customer 1: 在'平均折扣率'屬性上最大,可定義為重要發展客戶
Customer 2: 在'飛行總計' '飛行總里程'屬性上較小,定義為一般客戶
Customer 3: 在'飛行總計' '飛行總里程'屬性最小,定義為低價值客戶
Customer 4: 在'飛行總計' '飛行總里程'屬性最大,定義為重要保持客戶
Customer 5: 在'入會時長'屬性最大,定義為重要挽留客戶
每種客戶類別的特征如下:
1.重要保持客戶:'平均折扣率'(平均折扣率較高、倉位等級較高)、'飛行總計'、'飛行總里程'較高,'上一次飛行距今'(最近乘坐航班)低。應將資源優先投放到這類客戶身上,進行差異化管理,提高客戶的忠誠度和滿意度。
2.重要發展客戶:'平均折扣率'較高,這類客戶入會時長短、當前價值低、發展潛力大,應促使客戶增加在本公司和合作伙伴處的消費。
3.重要挽留客戶:'平均折扣率'、'飛行總計'、'飛行總里程'較高,客戶價值變化的不確定性高。應掌握客戶最新信息、維持與客戶的互動。
4.一般和低價值客戶:其他屬性都低、'上一次飛行距今'較高。這類客戶可能在打折促銷時才會選擇消費。