一、概述 KS(Kolmogorov-Smirnov)评价指标,通过衡量好坏样本累计分布之间的差值,来评估模型的风险区分能力。 KS、AUC、PR曲线对比: 1)ks和AUC一样,都是利用TPR ...
一、概述 KS(Kolmogorov-Smirnov)评价指标,通过衡量好坏样本累计分布之间的差值,来评估模型的风险区分能力。 KS、AUC、PR曲线对比: 1)ks和AUC一样,都是利用TPR ...
一般在建立分类模型时,需要对连续变量离散化,特征离散化后,模型会更稳定,降低了模型过拟合的风险。比如在建立申请评分卡模型时用logsitic作为基模型就需要对连续变量进行离散化,离散化通常采用分箱法。 ...
由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知。稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发 ...
一、简介 孤立森林(Isolation Forest)是另外一种高效的异常检测算法,它和随机森林类似,但每次选择划分属性和划分点(值)时都是随机的,而不是根据信息增益或者基尼指数来选择。在建树过程中 ...
一、风险模型 1)在抽取样本的时候,最少需要有两期表现才可以,逾期超过15的label=1,逾期小于5天的label=0,因为逾期小于5天的有些可能是因为忘记的,意愿上并不愿意真正逾期。正负样本比例 ...