原文:【第17期Datawhale | 零基础入门金融风控-贷款违约预测】Task02打卡:探索性数据分析 【pandas_profiling生成数据报告异常,解决后单开一篇】

零基础入门金融风控 贷款违约预测 Task 探索性数据分析 Task 目的: 熟悉整体数据集的基本情况,异常值,缺失值等, 判断数据集是否可以进行接下来的机器学习或者深度学习建模. 了解变量间的项目关系 变量与预测值之间的存在关系 为特征工程作准备 准备数据 输出 易得 结果列 isDefault testA相较于train多出两列: n . n . . . 通过nrows参数, 来设置读取文件的 ...

2020-09-18 23:01 0 467 推荐指数:

查看详情

【第17Datawhale | 零基础入门金融-贷款违约预测Task03打卡:特征工程之特征预处理、异常值处理、数据分桶、特征交互、特征编码、特征选择等 【留了大量TODO需要深入学习】

md 零基础入门金融-贷款违约预测 Task03 特征工程 Task03目的: 学习特征预处理/缺失值处理/异常值处理/数据分桶等特征处理方法 学习特征交互/特征编码/特征选择的相应方法 0.0 导包 0.1 公共变量 0.2 数据读取pandas ...

Tue Sep 22 07:50:00 CST 2020 0 440
阿里云的金融-贷款违约预测_数据分析

一、赛题数据 数据大家可以到官网去下载:https://tianchi.aliyun.com/competition/entrance/531830/information需要报名才可以下载数据 赛题以预测用户贷款是否违约为任务,数据集报名可见并可下载,该数据来自某信贷平台的贷款记录,总数据 ...

Fri Sep 11 23:21:00 CST 2020 0 1519
探索性数据分析

探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法,该方法在上世纪70年代由美国统计学家J.K.Tukey提出。传统的统计分析方法常常先假设数据 ...

Sun May 19 00:24:00 CST 2019 0 996
探索性数据分析

简介   探索性数据分析所谓探索性数据分析( Exploratory Data Analysis )以下简称EDA,是指对已有的数据( 特别是调查或观察得来的原始数据 )在尽量少的先验假定下进行探索通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 目录 ...

Sun Sep 03 04:03:00 CST 2017 0 1671
金融贷款违约预测笔记

要求 根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款数据概况 总数据量超过120w,包含47列变量信息,其中15列为匿名变量。从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时对employmentTitle、purpose ...

Wed Sep 16 22:38:00 CST 2020 0 500
数据分析(一)探索性分析

。   我们对大数据以及大数据分析完全没有头绪,我们甚至对大数据技术产生了迷茫,产生了退缩。   当我们拿到 ...

Wed Dec 30 10:31:00 CST 2015 0 5904
探索性数据分析EDA综述

目录 1. 数据探索的步骤和准备 2. 缺失值处理 为什么需要处理缺失值 Why data has missing values? 缺失值处理的技术 3. 异常值检测和处理 What is an outlier? What are the types ...

Sat Oct 06 05:40:00 CST 2018 0 986
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM