花费 51 ms
ML神器:sklearn的快速使用

  传统的机器学习任务从开始到建模的一般流程是:获取数据 -> 数据预处理 -> 训练建模 -> 模型评估 -> 预测,分类。本文我们将依据传统机器学习的流程,看看在每一步流程 ...

Fri Nov 10 18:54:00 CST 2017 4 131010
特征提取方法: one-hot 和 TF-IDF

one-hot 和 TF-IDF是目前最为常见的用于提取文本特征的方法,本文主要介绍两种方法的思想以及优缺点。 1. one-hot 1.1 one-hot编码   什么是one-hot编码?o ...

Tue Oct 31 03:58:00 CST 2017 7 41572
离散型特征编码方式:one-hot与哑变量*

  在机器学习问题中,我们通过训练数据集学习得到的其实就是一组模型的参数,然后通过学习得到的参数确定模型的表示,最后用这个模型再去进行我们后续的预测分类等工作。在模型训练过程中,我们会对训练数据集进行 ...

Tue Nov 07 01:13:00 CST 2017 0 21686
K-means 算法

本学习笔记参考自吴恩达老师机器学习公开课 聚类算法是一种无监督学习算法。k均值算法是其中应用最为广泛的一种,算法接受一个未标记的数据集,然后将数据聚类成不同的组。K均值是一个迭代算法,假设我 ...

Wed Dec 06 02:48:00 CST 2017 1 10820
神经网络学习笔记-入门篇*

1简单模型 vs 复杂模型   对于一个崭新的机器学习的任务,在模型选取和特征向量获取上通常我们会有两种选择方式:a. 简单模型 + 复杂特征项;b. 复杂模型 + 简单特征项。这两种方式各有各的优 ...

Mon Nov 20 00:20:00 CST 2017 1 10173
细品 - 逻辑回归(LR)*

1. LR的直观表述 1.1 直观表述   今天我们来深入了解一个工业界应用最多,虽然思想简单但也遮挡不住它NB光芒的绽放的一个分类预测模型,它就是LR模型。LR模型可以被认为就是一个被Sigmo ...

Sun Oct 22 01:32:00 CST 2017 1 5998
LR多分类推广 - Softmax回归*

  LR是一个传统的二分类模型,它也可以用于多分类任务,其基本思想是:将多分类任务拆分成若干个二分类任务,然后对每个二分类任务训练一个模型,最后将多个模型的结果进行集成以获得最终的分类结果。一般来说 ...

Mon Nov 06 01:33:00 CST 2017 0 5497
ML - 特征选择

1. 决策树中的特征选择   分类决策树是一种描述对实例进行分类的树型结构,决策树学习本质上就是从训练数据集中归纳出一组分类规则,而二叉决策树类似于if-else规则。决策树的构建也是非常的简单,首 ...

Mon Nov 13 22:21:00 CST 2017 5 2780
细品 - 过拟合与模型选择*

`欠拟合和过拟合   欠拟合是指模型不能很好的捕获到数据特征,不能很好的拟合数据,学习能力底下。解决方法:增加模型的复杂度        过拟合是指模型不仅仅学习了数据集中的有效信息,也学习到了 ...

Sun Nov 05 01:04:00 CST 2017 0 1474

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM