原文:数据分析中的变量编码——德国信贷数据集(data coding in data analysis-German credit datasets)

最近看了一本 Python金融大数据风控建模实战:基于机器学习 机械工业出版社 这本书,看了其中第 章:变量编码的方法 内容,总结了主要内容以及做了代码详解,分享给大家。 . 主要知识点 在统计学中,将变量按照取值是否连续分为离散变量和连续变量。例如性别就是离散变量,变量中只有男 女 未知三种情况 年龄是连续变量,是 的整数 假设 岁是年龄的最大值 。而建模中的预测模型都只能对数值类型进行建模分 ...

2021-10-05 17:44 0 134 推荐指数:

查看详情

数据分析变量选择——德国信贷数据集(variable selection in data analysis-German credit datasets

最近看了一本《Python金融大数据风控建模实战:基于机器学习》(机械工业出版社)这本书,看了其中第7章:变量选择 内容,总结了主要内容以及做了代码详解,分享给大家。 1. 主要知识点 变量选择是特征工程中非常重要的一部分。特征工程是一个先升维后降维的过程。升维的过程是结合业务理解尽可 ...

Mon Oct 25 19:08:00 CST 2021 0 917
数据分析变量分箱——德国信贷数据集(variable bin in data analysis -German credit datasets

最近看了一本《Python金融大数据风控建模实战:基于机器学习》(机械工业出版社)这本书,看了其中第6章:变量分箱方法 内容,总结了主要内容以及做了代码详解,分享给大家。 一、 主要知识点: 1. 变量分箱是一种特征工程方法,意在增强变量的可解释性与预测能力。变量分箱方法主要用于连续变量 ...

Sat Oct 16 01:53:00 CST 2021 0 990
探索性数据分析(Exploratory Data Analysis,EDA)

探索性数据分析(Exploratory Data Analysis,EDA)主要的工作是:对数据进行清洗,对数据进行描述(描述统计量,图表),查看数据的分布,比较数据之间的关系,培养对数据的直觉,对数据进行总结等。 探索性数据分析(EDA)与传统统计分析(Classical ...

Sat Aug 24 22:01:00 CST 2019 0 3375
Python 探索性数据分析(Exploratory Data Analysis,EDA)

探索性数据分析,主要针对原始数据进行初次了解。了解数据的分布情况、了解分析方向、排除该单个变量的异常值 等。此脚本读取的是 SQL Server ,只需给定表名或视图名称,如果有数据,将输出每个字段符合要求的每张数据分布图。 显示图分为字符型(离散型)和数值型(连续型),示例结果如下: ...

Sat Jan 13 00:11:00 CST 2018 0 9995
1.探索性数据分析(EDA,Exploratory Data Analysis

一、数据探索 1.数据读取 遍历文件夹,读取文件夹下各个文件的名字:os.listdir() 方法:用于返回指定的文件夹包含的文件或文件夹的名字的列表。这个列表以字母顺序。 它不包括 '.' 和'..' 即使它在文件夹。 1.1 CSV格式数据 详细说明 (1)读取 ...

Mon Jul 08 08:06:00 CST 2019 0 3123
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM