1.(IV 信息量 )在用邏輯回歸模型方法構建分類模型時候,需要對自變量進行篩選
使用信息量 IV , 來衡量自變量的預測能力。 信息量越大 預測能力越強,就越應該放入 模型中。
2.(WOE值)是 IV值的基礎。 即 證據權重 Weight of Evidence.
WOE 是對原始自變量的一種編碼形式。而要對一個變量進行WOE編碼 ,先要對變量進行分組處理(離散化、分箱等)。
WOEi =ln(pyi / pni)
PYi 表示組中 響應客戶占所有響應客戶的比例,PNi 表示組中未響應客戶占所有未響應客戶的比例。
IVi = (pyi - pni) * WOEi
IV值如果小於 0.02 對預測幾乎無幫助; IV 值 小於0.1 大於或等於 0.02 具有一定幫助。大於0.1就對預測有較大幫助了。
3. 評分
知識點補充:
最大信息熵增益_信息、信息熵、條件熵、互信息,信息增益、信息增益比、基尼系數、相對熵、交叉熵,KL散度,woe,IV值,混淆矩陣(TPR,FPR,F1),ROC,AUC,ks曲線,ks值
