python信用評分卡建模(附代碼,博主錄制)
https://blog.csdn.net/LuYi_WeiLin/article/details/88624268轉載
組合評分卡模型
本篇文章主要總結以下內容
- 組合模型的概念
- 常見結構的評分組合模型
- 單一模型選擇需要什么條件
- 串行結構組合模型實例
- 並行結構組合模型實例
組合模型的概念
常見結構的評分組合模型
- 串行結構組合模型實例
需要注意的是,一般工作中會把GBDT、神經網絡、深度學習排在前面(因為精度高),邏輯回歸、決策樹放在后面
並行結構組合模型實
混合結構組合模型實例(不易於解釋,一般不在評分卡使用)
單一模型選擇需要什么條件
為什么單一模型之間要保證錯誤率的相互獨立?
因為組合模型基於原理就是錯誤率相對獨立,多個單一模型組合會使得組合模型錯誤率趨於0,也就是如下圖;假如單一模型之間都完全不獨立的話,單一模型和組合模型預測一樣
為什么單一模型的復雜度要適度?
因為我們知道組合模型的復雜度會大於單一模型的復雜度的,假如單一模型就很復雜了,組合模型的復雜度可想而知
其次,復雜度高一般就很難提高精度了,再想從組合模型提高精度,模型會越來越復雜
為什么單一模型不是越多越好?
因為在完全獨立的情況下,隨着單一模型數量的增多,組合模型的錯誤率降低的速率已經沒有那么明顯了,而且隨着單一模型的增加,成本會增加。單一模型數量增加復雜度也會上升,響應時間會加長,在實際工作線上比如反欺詐模型要求時效性高要求毫秒級響應,所以數量並非越多越好。
根據模型的構成維度可以分為:並行組合、串行組合
根據單一分類器類型可以分為:同態組合、異態組合
所以就會有四種類型的組合模型模式
串行結構組合模型實例
- 同態串行組合(一般不使用,同態串行組合錯誤率相互獨立性弱,沒有太大的提升效果)
- 異態串行組合
精度高的模型排在前面
以多層神經網絡和邏輯回歸異態串行組合評分模型為例
神經網絡模型不一定需要WOE編碼,但是神經網絡模型要求是數值型輸入,我們也可以采用其他編碼
單一邏輯回歸與多層神經網絡加邏輯回歸得出的KS與AUC對比
我這里異態串行組合提升不明顯的原因是神經網絡沒有經過一個仔細的調參以及輸入節點太少
圖中融合器針對分類問題,可以
圖中融合器針對回歸問題,可以
異態並行組合
為什么轉換為log odds?方便分數的直接運算,因為分數的表達式如下,分數和分數就可以直接加權平均了
同態並行組合
Boosting
RSM
python風控建模實戰lendingClub(博主錄制,catboost,lightgbm建模,2K超清分辨率)
https://study.163.com/course/courseMain.htm?courseId=1005988013&share=2&shareId=400000000398149
微信掃二維碼,免費學習更多python資源