如何構建分類模型


1.(IV 信息量 )在用邏輯回歸模型方法構建分類模型時候,需要對自變量進行篩選

使用信息量 IV , 來衡量自變量的預測能力。 信息量越大 預測能力越強,就越應該放入 模型中。

2.(WOE值)是 IV值的基礎。 即 證據權重 Weight of Evidence.

WOE 是對原始自變量的一種編碼形式。而要對一個變量進行WOE編碼 ,先要對變量進行分組處理(離散化、分箱等)。

 

WOEi =ln(pyi / pni)  

PYi 表示組中 響應客戶占所有響應客戶的比例,PNi 表示組中未響應客戶占所有未響應客戶的比例。

 

IVi = (pyi - pni) * WOEi

IV值如果小於 0.02 對預測幾乎無幫助; IV 值 小於0.1 大於或等於 0.02 具有一定幫助。大於0.1就對預測有較大幫助了。

 

3. 評分

知識點補充:

最大信息熵增益_信息、信息熵、條件熵、互信息,信息增益、信息增益比、基尼系數、相對熵、交叉熵,KL散度,woe,IV值,混淆矩陣(TPR,FPR,F1),ROC,AUC,ks曲線,ks值


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM