要求 根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款。 数据概况 总数据量超过120w,包含47列变量信息,其中15列为匿名变量。从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时对employmentTitle、purpose ...
本系列是针对于DataWhale学习小组的笔记,从一个对统计学和机器学习理论基础薄弱的初学者角度出发,在小组学习资料和其他网络资源的基础上,对知识进行总结和整理,今后有了新的理解可能还会不断完善。由于水平实在有限,不免产生谬误,欢迎读者多多批评指正。如需要转载请与博主联系,谢谢 比赛核心思路 赛题内容理解 比赛目标及数据 本场比赛的目标属于典型的分类问题,即依靠某信贷平台提供的超过 万条贷款记录, ...
2020-09-15 23:46 1 687 推荐指数:
要求 根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款。 数据概况 总数据量超过120w,包含47列变量信息,其中15列为匿名变量。从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时对employmentTitle、purpose ...
模型融合 5.1 学习目标 将之前建模调参的结果进行模型融合。 尝试多种融合方案,提交融合结果并打卡。(模型融合一般用于A榜比赛的尾声和B榜比赛的全程) 5.2 内容介绍 模型融合是比赛后期上分的重要手段,特别是多人组队学习的比赛中,将不同队友的模型进行融合,可能会收获意想不到的效果 ...
特征工程 项目地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskCont ...
贷款违约预测-赛题理解&基线预测 天池鱼佬直播 原网址: https://tianchi.aliyun.com/course/video?liveId=41203 下载地址: https://tianchi-media.oss-cn-beijing.aliyuncs.com ...
一、赛题数据 数据大家可以到官网去下载:https://tianchi.aliyun.com/competition/entrance/531830/information需要报名后才可以下载数据 赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数 ...
建模与调参 4.1 学习目标 学习在金融分控领域常用的机器学习模型 学习机器学习模型的建模过程与调参流程 4.2 内容介绍 逻辑回归模型: 理解逻辑回归模型; 逻辑回归模型的应用; 逻辑回归的优缺点; 树模型 ...
本文根据阿里天池学习赛《快来一起挖掘幸福感!》撰写 加载数据 加载的是完整版的数据 happiness_train_complete.csv 。 数据集基本信息的探索 下面简单输出前5行查看。 .dataframe tbody tr th ...
零基础入门金融风控-贷款违约预测 Task02 探索性数据分析 Task02目的: 熟悉整体数据集的基本情况,异常值,缺失值等, 判断数据集是否可以进行接下来的机器学习或者深度学习建模. 了解变量间的项目关系/变量与预测值之间的存在关系 为特征工程作准备 准备数据 ...