零基础入门金融风控-贷款违约预测 Task02 探索性数据分析 Task02目的: 熟悉整体数据集的基本情况,异常值,缺失值等, 判断数据集是否可以进行接下来的机器学习或者深度学习建模. 了解变量间的项目关系/变量与预测值之间的存在关系 为特征工程作准备 准备数据 ...
md 零基础入门金融风控 贷款违约预测 Task 特征工程 Task 目的: 学习特征预处理 缺失值处理 异常值处理 数据分桶等特征处理方法 学习特征交互 特征编码 特征选择的相应方法 . 导包 . 公共变量 . 数据读取pandas . . 特征预处理 . . . 解析出数字属性列和类别属性列 . . . 缺失值填充 . . . 对象类型特征转换到数值 特指 employmentLength 就 ...
2020-09-21 23:50 0 440 推荐指数:
零基础入门金融风控-贷款违约预测 Task02 探索性数据分析 Task02目的: 熟悉整体数据集的基本情况,异常值,缺失值等, 判断数据集是否可以进行接下来的机器学习或者深度学习建模. 了解变量间的项目关系/变量与预测值之间的存在关系 为特征工程作准备 准备数据 ...
特征工程 项目地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl 3.1 学习目标 学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法 ...
1. 特征工程之特征预处理 2. 特征工程之特征选择 1. 前言 “数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过特征工程得到的数据。特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器学习模型逼近这个上限。特征 ...
在前面我们分别讨论了特征工程中的特征选择与特征表达,本文我们来讨论特征预处理的相关问题。主要包括特征的归一化和标准化,异常特征样本清洗与样本数据不平衡问题的处理。 1. 特征的标准化和归一化 由于标准化和归一化这两个词经常混用,所以本文不再区别标准化和归一化,而通过具体 ...
*特征工程是一个复杂活,本人认为它一般包括以下几个过程:特征初筛、特征衍生(加工)、特征选择; 特征筛选是一个精细活,需要考虑很多因素,比如:预测能力、相关性、稳定性、合规性、业务可解释性等等。 案例实践代码:https://github.com/iihcy/Credit_ACard 从广义 ...
基础概念 特征工程是通过对原始数据的处理和加工,将原始数据属性通过处理转换为数据特征的过程,属性是数据本身具有的维度,特征是数据中所呈现出来的某一种重要的特性,通常是通过属性的计算,组合或转换得到的。比如主成分分析就是将大量的数据属性转换为少数几个特征的过程。某种程度而言,好的数据以及特征往往是 ...
来源:https://www.zhihu.com/question/29316149/answer/110159647 目录 1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 ...
目录 1 Filter 1.1 移除低方差特征(Removing features with low variance) 1.2 单变量特征选择 (Univariate feature selection) 1.2.1 卡方检验 (Chi2) 1.2.2 ...