前言 本系列教程基本就是摘抄《Python机器学习基础教程》中的例子内容。 为了便于跟踪和学习,本系列教程在Github上提供了jupyter notebook 版本: Github仓库:https://github.com/Holy-Shine ...
. 分类与回归 分类:就是根据给定的标签,把新的数据划分到这些标签中的一个 回归:就是根据事物一些属性,来判断这个事物的另一个属性在哪个区间范围 比如:根据一个人的受教育程度,年龄等,判断这个人的收入在哪个范围内 区别: 分类的输出是固定的,离散的,是一个点 回归的输出是连续的,是区间. .泛化,过拟合与欠拟合 泛化:一个模型能够对没见过的数据做出准确预测,就说模型能够从训练集泛化到测试集 过拟 ...
2019-08-21 23:54 0 540 推荐指数:
前言 本系列教程基本就是摘抄《Python机器学习基础教程》中的例子内容。 为了便于跟踪和学习,本系列教程在Github上提供了jupyter notebook 版本: Github仓库:https://github.com/Holy-Shine ...
前言 本系列教程基本就是摘抄《Python机器学习基础教程》中的例子内容。 为了便于跟踪和学习,本系列教程在Github上提供了jupyter notebook 版本: Github仓库:https://github.com/Holy-Shine ...
监督学习 0.线性回归(加L1、L2正则化) from __future__ import print_function from pyspark.ml.regression import ...
前面对半监督学习部分作了简单的介绍,这里开始了解有关无监督学习的部分,无监督学习内容稍微较多,本节主要介绍无监督学习中的PCA降维的基本原理和实现。 PCA 0.无监督学习简介 相较于有监督学习和半监督学习,无监督学习就是从没有标签的数据中进行知识发现的过程。 更具体地说,无监督学习 ...
一:降维之数据压缩 将讨论第二种无监督学习的问题:降维。数据压缩不仅能让我们对数据进行压缩,使得数据占用较少的内存和硬盘空间,还能对学习算法进行加速。 (一)降维是什么(二维降至一维) 假使我们要采用两种不同的仪器来测量一些东西的尺寸,其中一个仪器测量结果的单位是英寸,另一个仪器测量的结果是 ...
前面主要回顾了无监督学习中的三种降维方法,本节主要学习另一种无监督学习AutoEncoder,这个方法在无监督学习领域应用比较广泛,尤其是其思想比较通用。 AutoEncoder 0.AutoEncoder简介 在PCA一节中提到,PCA的可以看做是一种NN模型,通过输入数据,乘以权重w ...
前面说了一部分有监督学习的有关算法,本节主要对半监督学习做一个简单的介绍,当然,有监督学习还有很多其他的算法,后面会不断完善和补充。 半监督学习简介 0.前言 这里半监督学习的内容只做一些初步的介绍,理解半监督学习是如何进行学习的,主要叙述原理,看一下半监督学习是如何工作的,不针对 ...
传统的 机器学习 技术分为两类,一类是无监督学习,一类是监督学习。 无监督学习只利用未标记的样本集,而监督学习则只利用标记的样本集进行学习。 但在很多实际问题中,只有少量的带有标记的数据,因为对数据进行标记的代价有时很高,比如在生物学中,对某种蛋白质的结构分析或者功能鉴定 ...