原文鏈接 https://blog.csdn.net/LuYi_WeiLin/article/details/87907948
(八)行為評分卡模型(B卡)的介紹
在信貸業務中,評分卡分為三種:
申請評分卡(A卡)
行為評分卡(B卡)
催收評分卡(C卡)
本篇我們來學習一下行為評分卡(B卡),首先什么是行為評分卡呢,行為評分卡的使用場景以及目的,適用的信貸產品?
其中特別注意一下,不適合先息后本的信貸產品,因為每個月的違約概率不一樣,不好預測
觀察期和表現期
學習行為評分卡之前,要了解一些概念,什么是觀察期和表現期,什么是觀察點
觀察期觀察的是行為,表現期預測表現好壞
P(表現期好壞/觀察期行為)
這里要注意一下,假如我們定義表現壞客戶為M3+,觀察期時間窗口為12個月,則起碼要收集12+3個月的數據
當然觀察點也不宜太長,因為不到MOB的客戶,不能進入行為評分卡中,會丟失大量重要數據
當此刻的時間滿足了MOB但是不滿足觀察期,也可以構建B卡,但是有一些變量表現效果不怎么好(因為和每個變量的收集間隔有關,間隔長的變量收集得太少,表現自然不佳)
講完了觀察期和表現期,我們就來講一下信用評分卡常用的特征構造,特征構造之前我們來學習一個定義:時間切片
特征構造
一般有以下幾類特征
還款率類型的特征
額度使用率類型的特征
逾期類型的特征
這里注意一下,不能用輕度逾期去預測輕度逾期,不能用重度逾期去預測重度逾期,這里的目標變量是DPD(day past due)90,變量可以是DPD60、DPD30等
消費類型的特征(每一筆消費有具體詳細可以做)
三方機構(社交數據、出行數據)
下面就來講解一下行為評分卡建立模型的步驟(和申請評分卡差不多)
數據預處理
特征衍生
特征處理與篩選
特征挑選
變量分箱
模型的參數估計(邏輯回歸模型)
添加完所有變量后,邏輯回歸結果如下圖所示,還是存在P值不顯著情況,單獨拿去這些變量一個一個與目標變量進行邏輯回歸檢驗其顯著性
也就是挑選4個GBDT模型最重要的變量進行邏輯回歸后,發現其邏輯回歸系數為負,之后我們按照GBDT模型變量重要性降序順序一個一個往里面加,每加一個,進行一次邏輯回歸,發現存在邏輯回歸系數為正的,就可以把該變量剔除
邏輯回歸要求系數為負而且P值要顯著,我們使用外生模型GBDT估計模型重要性
所以,我們使用LASSO再次進行變量挑選
模型的性能測試
概率轉換為分數
python金融風控評分卡模型和數據分析微專業課(博主親自錄制視頻):http://dwz.date/b9vv
歡迎關注博主主頁,學習python視頻資源,還有大量免費python經典文章
機器學習,統計項目可聯系QQ:231469242