标签【SKlearn】 - 码上欢乐

　　学习机器学习童鞋们应该都知道决策树是一个非常好用的算法，因为它的运算速度快，准确性高，方便理解，可以处理连续或种类的字段，并且适合高维的数据而被人们喜爱，而Sklearn也是学习Python实现机 ...

sklearn中的数据预处理和特征工程

　　小伙伴们大家好~o(￣▽￣)ブ，沉寂了这么久我又出来啦，这次先不翻译优质的文章了，这次我们回到Python中的机器学习，看一下Sklearn中的数据预处理和特征工程，老规矩还是先强调一下我的开发环 ...

一概述回归分析模型：销售额 =93765+0.3* 百度+0.15 * 社交媒体+0.05 *电话直销+0.02 * 短信线性回归研究自变量 x 对因变量 y 影响 ...

孤立森林 Isolation Forest（sklearn.ensemble.IsolationForest）：一种适用于连续数据的无监督异常检测方法。与随机森林类似，都是高效的集成算法，相 ...

机器学习入门之sklearn介绍

SKlearn简介 scikit-learn，又写作sklearn，是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实 ...

一概述聚类分析目的将大量数据集中具有“相似”特征的数据点或样本划分为一个类别常见应用场景在没有做先验经验的背景下做的探索性分析 ...

说明： 1 string_data 是挑出来的需要转成数值型特征的分类特征 2 转换后，通常要将 array 类型的结果转成 DataFrame，与其他的特征合并 ...

LDA与QDA

作者：桂。时间：2017-05-23 06:37:31 链接：http://www.cnblogs.com/xingshansi/p/6892317.html 前言仍然是py ...

用Sklearn画一颗决策树

小伙伴们大家好~o(￣▽￣)ブ，首先声明一下，我的开发环境是Jupyter lab，所用的库和版本大家参考：　　Python 3.7.1（你的版本至少要3.4以上　　Scikit-learn ...

目录 1 Filter 　　1.1 移除低方差特征（Removing features with low variance）　　1.2 单变量特征选择 (Univariate feature ...