本次竞赛提供的数据源一共有五个,依次做特征提取 一、信用卡账单特征提取 1、基本思路:将数据分成时间已知时间未知两部分,时间已知中再分成放款前的数据和放款后的数据,放款前放款后的再分成去重的数据和不去重数据,最终对数据做sum,count,mean,max,min,median,std等指标 ...
竞赛地址:http: www.pkbigdata.com common cmpt E A E B E B B E AC BE E A E E A E A E B B E B B E BD E B E E B E D AE.html 数据探索: 比赛一共提供五张表,分别是: 训练数据:用户基本属性,银行流水记录,用户浏览行为,信用卡账单记录,放款时间,是否逾期 测试数据:用户基本属性,银行流水记录, ...
2018-04-03 10:44 0 2264 推荐指数:
本次竞赛提供的数据源一共有五个,依次做特征提取 一、信用卡账单特征提取 1、基本思路:将数据分成时间已知时间未知两部分,时间已知中再分成放款前的数据和放款后的数据,放款前放款后的再分成去重的数据和不去重数据,最终对数据做sum,count,mean,max,min,median,std等指标 ...
数据源:融360-用户贷款风险预测 参考资料:https://www.jianshu.com/p/aba5685c580a 流程如下: 项目目标 数据解读 数据预处理 特征工程 1.基于业务理解筛选 2.基于机器学习筛选 模型建立 一、项目目标 ...
零基础入门金融风控-贷款违约预测 Task02 探索性数据分析 Task02目的: 熟悉整体数据集的基本情况,异常值,缺失值等, 判断数据集是否可以进行接下来的机器学习或者深度学习建模. 了解变量间的项目关系/变量与预测值之间的存在关系 为特征工程作准备 准备数据 ...
,返料风,给水水量;以及锅炉的工况,比如锅炉床温、床压,炉膛温度、压力,过热器的温度等。 数据为:经 ...
一、赛题数据 数据大家可以到官网去下载:https://tianchi.aliyun.com/competition/entrance/531830/information需要报名后才可以下载数据 赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据 ...
要求 根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款。 数据概况 总数据量超过120w,包含47列变量信息,其中15列为匿名变量。从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时对employmentTitle、purpose ...
工具导入和数据读取 工具导入 数据读取 数据集样例查看 user_id merchant_id label 0 34176 3906 1 34176 ...
文章目录 1、明确需求和目的 现代社会,越来越多的人使用信用卡进行消费,大部分人使用信用卡之后会按时还款,但仍然有少部分人不能在约定时间进行还款,这大大的增加了银行或者金融机构的风险。 本文以某金融机构的历史数据进行建模分析,对客户的还款能力进行评估,以预测新客户 ...