評分卡

本文轉載自查看原文 2019-07-02 21:51 569

評分卡常用模型與算法（應用了解模型，原理了解算法）

　　模型：邏輯回歸模型、決策樹模型、神經網絡模型、模型融合

　　算法：MLE、Gradient Descent、RF、GBDT、XGboost、LGBM、BP算法、Stacking、Blending

信用風險評分卡全流程：

一、模型設計

　　業務理解：進一步理解業務部門的業務需求、業務發展目標和需要解決的問題。

　　排除規則：根據業務實際情況，制定樣本排除規則。

　　目標定義：根據業務實際情況，結合壞賬率分析、滾動率分析、好壞客群數量比例分析，定義目標變量。

　　樣本選取：決定樣本的觀察期、表現期，同時將樣本分為訓練集、同時間測試集、跨時間測試集。

　　1.排除規則（A卡）：黑名單客戶、欺詐客戶、政策影響、VIP、資產變賣、產品變更

　　2.目標定義→轉移矩陣：看初始狀態變到更差的比例來選擇逾期多少天

　　3.樣本窗口：看累計壞賬百分比確定觀察期多長

二、客群細分分析（國內不常見）

　　1.不同組別的個體行為不同

　　2.已知變量的預測能力對不同組別的作用表現也不同

　　3.對不同組別分別進行模型開發，體現預測變量的差異性

　　4.最終結果是在所有目標子群體中增加預測能力

三、拒絕推斷（實現法：花錢買數據、直接賦值法、模型擴展法）

　　申請客群→拒絕黑名單與欺詐客戶（F卡）→拒絕高信用風險客戶+審批通過（A卡信用評分卡的目標客群）

四、評分卡開發

　　　　　　數據備份

　　　　　　單變量分析　　→　　變量分布，異常值分析等

　　　　　　缺失值補全　　→　　均值、中位數、分箱、模型

　　　　　　數據拆分　　 →　　訓練集、測試集、跨時間測試集

　　　　　　變量分箱+邏輯回歸 / 樹形分類器　　→　　變量選擇，模型擬合

　　　　　　模型評估　　　→　　計算KS、ROC、GINI等統計指標

　　　　　　轉換評分卡　　→　　將概念轉換為分數，選擇閾值，並計算混淆矩陣

　　1.單變量分析——異常值處理（極大或極小值、不符合邏輯數據、分布）

　　2.單變量分析——缺失值處理：缺失值補全

　　　　a.單一值補全（數值型：均值/中位數；分類型：新增類別）

　　　　b.分組補全（數值型：均值/中位數）

　　　　c.模型預測（利用多變量模型預測）

　　　　d.WOE補全（僅限LR模型，直接計算WOE）

五、特征變量——衍生變量（特征工程）先增加后減少

六、特征變量——降維流程

　　業務理解　　→　　覆蓋率　　→　　IV值篩選　　→　　PSI篩選　　→　　算法降維　　→　　多重共線性

　　1.覆蓋率：看缺失值，超過一定比例刪掉

　　2.IV值：WOE組內好壞差異和全局好壞差異的比較

　　　　　 IV（各組好壞差異*權重）再求和

　　3.PSI衡量兩組樣本偏評分或分布是否有顯著差異

　　4.算法降維

　　5.VIF查看多重共線性

七、模型評估——混淆矩陣

　　准確率、召回率、精准率、F1 Score

　　模型評估——統計指標

　　1.K-S：分類能力，累計好樣本比例與累計壞樣本比例的差值，也可FPR-TPR

　　2.ROC/AUC/GINI：排序能力

八、分數轉換

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 評分卡基於卡方分箱的評分卡建模信用卡評分 LightGBM與評分卡評分卡模型評分卡模型 python評分卡信用評分卡模型信用評分卡（一）信用評分卡9_申請評分卡介紹