注:本文中涉及到的公式一律省略(公式不好敲出来),若想了解公式的具体实现,请参考原著。 1、基本概念 (1)聚类的思想: 将数据集划分为若干个不想交的子集(称为一个簇cluste ...
一 矩阵求导 复杂矩阵问题求导方法:可以从小到大,从scalar到vector再到matrix。 x is a column vector, A is a matrix d A amp x x dx A d A x dx A d xT amp x A dxT A d xT A dxT A d xT amp x A dx AT d xT A dx AT d xT amp x A amp x x dx ...
2017-07-24 20:04 0 1372 推荐指数:
注:本文中涉及到的公式一律省略(公式不好敲出来),若想了解公式的具体实现,请参考原著。 1、基本概念 (1)聚类的思想: 将数据集划分为若干个不想交的子集(称为一个簇cluste ...
半监督学习:综合利用有类标的数据和没有类标的数据,来生成合适的分类函数。它是一类可以自动地利用未标记的数据来提升学习性能的算法 1、生成式半监督学习 优点:方法简单,容易实现。通常在有标记数据极少时,生成式半监督学习方法比其他方法性能更好 缺点:假设的生成式模型必须与真实 ...
数据预处理的常用流程: 1)去除唯一属性 2)处理缺失值 3)属性编码 4)数据标准化、正则化 5)特征选择 6)主成分分析 1、去除 ...
1、损失函数和风险函数 (1)损失函数:常见的有 0-1损失函数 绝对损失函数 平方损失函数 对数损失函数 (2)风险函数:损失函数的期望 经验风险:模型在数据集T上的平均损失 ...
注:因为公式敲起来太麻烦,因此本文中的公式没有呈现出来,想要知道具体的计算公式,请参考原书中内容 降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中 1、主成分分析(PCA) 将n维样本X通过投影矩阵W,转换为K维矩阵Z 输入:样本集D,低维空间d ...
###机器学习的基础概念 机器学习时一门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。 机器学习主要使用的学习方法是归纳,而不是演绎。 机器学习 ...
概率论的一些基础知识 条件概率 \(P(B|A) = \frac{1}{3}\) 表示的意思为当A发生的时候,B发生的概率 有公式 \[P(B|A) = \frac{P(AB)}{P(A)} \] \[P(AB) = P(B|A)*P(A)=P(A|B)*P(B ...