md 零基础入门金融风控-贷款违约预测 Task03 特征工程 Task03目的: 学习特征预处理/缺失值处理/异常值处理/数据分桶等特征处理方法 学习特征交互/特征编码/特征选择的相应方法 0.0 导包 0.1 公共变量 0.2 数据读取pandas ...
零基础入门金融风控 贷款违约预测 Task 探索性数据分析 Task 目的: 熟悉整体数据集的基本情况,异常值,缺失值等, 判断数据集是否可以进行接下来的机器学习或者深度学习建模. 了解变量间的项目关系 变量与预测值之间的存在关系 为特征工程作准备 准备数据 输出 易得 结果列 isDefault testA相较于train多出两列: n . n . . . 通过nrows参数, 来设置读取文件的 ...
2020-09-18 23:01 0 467 推荐指数:
md 零基础入门金融风控-贷款违约预测 Task03 特征工程 Task03目的: 学习特征预处理/缺失值处理/异常值处理/数据分桶等特征处理方法 学习特征交互/特征编码/特征选择的相应方法 0.0 导包 0.1 公共变量 0.2 数据读取pandas ...
强烈先全部看一遍各种报错原因,先全文浏览一遍,坑比较多~~ pandas_profiling安装的各种问题记录 常见如下: MemoryError... MemoryError: Unable to allocate 201. MiB for an array with shape (33 ...
一、赛题数据 数据大家可以到官网去下载:https://tianchi.aliyun.com/competition/entrance/531830/information需要报名后才可以下载数据 赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据 ...
探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法,该方法在上世纪70年代由美国统计学家J.K.Tukey提出。传统的统计分析方法常常先假设数据 ...
简介 探索性数据分析所谓探索性数据分析( Exploratory Data Analysis )以下简称EDA,是指对已有的数据( 特别是调查或观察得来的原始数据 )在尽量少的先验假定下进行探索通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 目录 ...
要求 根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款。 数据概况 总数据量超过120w,包含47列变量信息,其中15列为匿名变量。从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时对employmentTitle、purpose ...
。 我们对大数据以及大数据分析完全没有头绪,我们甚至对大数据技术产生了迷茫,产生了退缩。 当我们拿到 ...
目录 1. 数据探索的步骤和准备 2. 缺失值处理 为什么需要处理缺失值 Why data has missing values? 缺失值处理的技术 3. 异常值检测和处理 What is an outlier? What are the types ...