一、评分卡模型 PS:核心点在于我们需要一个判别指标来对数据进行打标签分类 1、项目简介: 信用评分技术是一种应用统计模型,其作用是对贷款申请人做风险评估分值的方法。在互金公司等各种贷款业务机构中,普遍使用信用评分,对客户实行打分制,以期对客户有一个优质与否的评判。评分卡主要 ...
作者:JSong,时间: . . 本文大量引用了 jasonfreak 的系列文章,在此进行注明和感谢. 广义的偏差 bias 描述的是预测值和真实值之间的差异,方差 variance 描述的是不同样本下模型效果的离散程度。在 Understanding the Bias Variance Tradeoff 当中有一副图形象地向我们展示了偏差和方差的关系: 一 Bias variance 分解 算 ...
2018-03-22 22:37 1 953 推荐指数:
一、评分卡模型 PS:核心点在于我们需要一个判别指标来对数据进行打标签分类 1、项目简介: 信用评分技术是一种应用统计模型,其作用是对贷款申请人做风险评估分值的方法。在互金公司等各种贷款业务机构中,普遍使用信用评分,对客户实行打分制,以期对客户有一个优质与否的评判。评分卡主要 ...
参考资料: 评分卡模型实战,toad库的使用 如何成为一名合格的风控算法工程师? kaggle竞赛give me some credit python实战 转自:<风控必备>评分卡A/B/C卡解析(内附流程图) 一、评分模型的种类(信用生命周期)1、新客户筛选1)风险 ...
写在前面:本文为本人所做数据分析关于信用评分卡的习作,使用的是一个多年前kaggle的一个数据集,所以已经有人做过相关的分析。正在学习增强中,水平有限,文中不当之处望各位多多指点。 一、 数据介绍 SeriousDlqin2yrs ...
最近在探索xgboost 调参事情,现在存在着几点问题: 1.调参方式,网上有多种调参方式,但是基本都是一个一个参数去调,贪心算法,只能满足局部最优,但是我们的参数都是相互影响的,局部最优,组合起来并非是最优的。 2.我基本都是确定几个参数的固定形式,比如说树的深度=3,最小叶节点=样本 ...
导入数据,这里我将逾期15天以上的都当作正类 1、评分卡简介 在进行下一步操作之前,我们先来解 ...
训练过程中的误差,就是训练误差。 在验证集上进行交叉验证选择参数(调参),最终模型在验证集上的误差就是验证误差。 训练完毕、调参完毕的模型,在新的测试集上的误差,就是测试误差。 假如所有的数据来自一个整体,模型在这个整体上的误差,就是泛化误差。通常说来,测试误差的平均值或者说期望就是泛化误差 ...
摘要:以前在机器学习中一直使用经验风险来逼近真实风险,但是事实上大多数情况经验风险并不能够准确逼近真实风险。后来业界就提出了泛化误差的概念(generalization error),在机器学习中泛化误差是用来衡量一个学习机器推广未知数据的能力,即根据从样本数据中学习到的规则能够应用到新数据的能力 ...