花费 57 ms
使用sklearn做单机特征工程

目录 1 特征工程是什么?2 数据预处理  2.1 无量纲化    2.1.1 标准化    2.1.2 区间缩放法    2.1.3 标准化与归一化的区别  2.2 对定量特征二值化  2.3 对 ...

Tue May 03 01:41:00 CST 2016 25 122491
特征选择 (feature_selection)

特征选择 (feature_selection) 目录 特征选择 (feature_selection) Filter 1. 移除低方 ...

Tue Mar 14 00:45:00 CST 2017 5 76032
特征工程之特征选择

    特征工程是数据分析中最耗时间和精力的一部分工作,它不像算法和模型那样是确定的步骤,更多是工程上的经验和权衡。因此没有统一的方法。这里只是对一些常用的方法做一个总结。本文关注于特征选择部分。后面 ...

Mon May 14 04:13:00 CST 2018 95 35529
特征工程之特征表达

在特征工程之特征选择中,我们讲到了特征选择的一些要点。本篇我们继续讨论特征工程,不过会重点关注于特征表达部分,即如果对某一个特征的具体表现形式做处理。主要包括缺失值处理,特殊的特征 ...

Sun May 20 06:39:00 CST 2018 97 18325
特征工程之特征预处理

    在前面我们分别讨论了特征工程中的特征选择与特征表达,本文我们来讨论特征预处理的相关问题。主要包括特征的归一化和标准化,异常特征样本清洗与样本数据不平衡问题的处理。 1. 特征的标准化和归一化 ...

Sun May 27 04:23:00 CST 2018 102 17762
谁动了我的特征?——sklearn特征转换行为全记录

目录 1 为什么要记录特征转换行为?2 有哪些特征转换的方式?3 特征转换的组合4 sklearn源码分析  4.1 一对一映射  4.2 一对多映射  4.3 多对多映射5 实践6 总结7 参考资 ...

Fri Jul 01 05:33:00 CST 2016 3 30259
学习《精通特征工程》中文PDF+英文PDF+代码对比

特征工程是机器学习流程中至关重要的一个环节,这方面的书较少,推荐学习《精通特征工程》,着重阐明特征工程的基本原则,介绍大量特征工程技术,学习从原始数据中提取出正确的特征并将其转换为适合机器学习模型的格 ...

Thu May 23 07:03:00 CST 2019 0 8312
数据预处理之离散化

按照我们对于变量的分类:分为数值变量和分类变量,数值变量可以分为连续型和离散型,分类变量又有有序的和无序的。下面我将介绍一些对于这些变量进行离散化处理。 无序分类变量的离散化方法: 比如 ...

Fri Mar 16 05:19:00 CST 2018 1 16167
评分卡系列(二):特征工程

时间:JSong 时间:2018.01.14 文章很长,理论和实现都讲的很细,大家可以先收藏,有时间再看。 在上一篇文章中,我们对LendingClub的数据有了一个大致的了解,这次我将 ...

Mon Jan 15 03:37:00 CST 2018 4 11810

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM