(信貸風控八)行為評分卡模型(B卡)的介紹


 python信用評分卡建模視頻系列教程(附代碼)  博主錄制

 

原文鏈接 https://blog.csdn.net/LuYi_WeiLin/article/details/87907948

(八)行為評分卡模型(B卡)的介紹

在信貸業務中,評分卡分為三種:

    申請評分卡(A卡)
    行為評分卡(B卡)
    催收評分卡(C卡)

本篇我們來學習一下行為評分卡(B卡),首先什么是行為評分卡呢,行為評分卡的使用場景以及目的,適用的信貸產品?

 

 

 

 


其中特別注意一下,不適合先息后本的信貸產品,因為每個月的違約概率不一樣,不好預測


觀察期和表現期

學習行為評分卡之前,要了解一些概念,什么是觀察期和表現期,什么是觀察點

 

 



觀察期觀察的是行為,表現期預測表現好壞

P(表現期好壞/觀察期行為)

這里要注意一下,假如我們定義表現壞客戶為M3+,觀察期時間窗口為12個月,則起碼要收集12+3個月的數據

 

 

當然觀察點也不宜太長,因為不到MOB的客戶,不能進入行為評分卡中,會丟失大量重要數據

當此刻的時間滿足了MOB但是不滿足觀察期,也可以構建B卡,但是有一些變量表現效果不怎么好(因為和每個變量的收集間隔有關,間隔長的變量收集得太少,表現自然不佳)


講完了觀察期和表現期,我們就來講一下信用評分卡常用的特征構造,特征構造之前我們來學習一個定義:時間切片

 

 



特征構造

一般有以下幾類特征

還款率類型的特征

 

 



    額度使用率類型的特征

 

 



    逾期類型的特征

這里注意一下,不能用輕度逾期去預測輕度逾期,不能用重度逾期去預測重度逾期,這里的目標變量是DPD(day past due)90,變量可以是DPD60、DPD30等

 

 



    消費類型的特征(每一筆消費有具體詳細可以做)

 

 



    三方機構(社交數據、出行數據)

 

下面就來講解一下行為評分卡建立模型的步驟(和申請評分卡差不多)

    數據預處理
    特征衍生

 

 


    特征處理與篩選

    特征挑選

 

 

 

 

 

 

 

     變量分箱
    模型的參數估計(邏輯回歸模型)


 

添加完所有變量后,邏輯回歸結果如下圖所示,還是存在P值不顯著情況,單獨拿去這些變量一個一個與目標變量進行邏輯回歸檢驗其顯著性

 

 

 
也就是挑選4個GBDT模型最重要的變量進行邏輯回歸后,發現其邏輯回歸系數為負,之后我們按照GBDT模型變量重要性降序順序一個一個往里面加,每加一個,進行一次邏輯回歸,發現存在邏輯回歸系數為正的,就可以把該變量剔除

 

 


邏輯回歸要求系數為負而且P值要顯著,我們使用外生模型GBDT估計模型重要性

 

 

 

所以,我們使用LASSO再次進行變量挑選

 

 

 

    模型的性能測試

 

 

 

    概率轉換為分數

 

 

 

python金融風控評分卡模型和數據分析微專業課(博主親自錄制視頻):http://dwz.date/b9vv

 

歡迎關注博主主頁,學習python視頻資源,還有大量免費python經典文章

機器學習,統計項目可聯系QQ:231469242






免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM