#对coursera上Andrew Ng老师开的机器学习课程的笔记和心得; #注:此笔记是我自己认为本节课里比较重要、难理解或容易忘记的内容并做了些补充,并非是课堂详细笔记和要点; #标记为<补充>的是我自己加的内容而非课堂内容,参考文献列于文末。博主能力有限,若有错误,恳请指正; #------------------------------------------------ ...
机器学习 聚类分析和主成分分析 在机器学习中,非监督性学习主要用来分类。其中重要的两种就是聚类分析和主成分分析。这两类算法在数据压缩和数据可视化方面有着广泛的应用。 所谓无监督学习是指训练集里面只有点 x ,x , ldots,x m ,没有对应的性质标签 y 。所以非监督性学习的目的不再是预测,而是分类。 一 聚类分析 经典的聚类分析算法是K mean算法。K是类的数目,mean是均值。 . K ...
2015-08-13 16:27 0 2060 推荐指数:
#对coursera上Andrew Ng老师开的机器学习课程的笔记和心得; #注:此笔记是我自己认为本节课里比较重要、难理解或容易忘记的内容并做了些补充,并非是课堂详细笔记和要点; #标记为<补充>的是我自己加的内容而非课堂内容,参考文献列于文末。博主能力有限,若有错误,恳请指正; #------------------------------------------------ ...
聚类分析(cluster analysis)是将一组研究对象分为相对同质的群组(clusters)的统计分析技术,即将观测对象的群体按照相似性和相异性进行不同群组的划分,划分后每个群组内部各对象相似度很高,而不同群组之间的对象彼此相异度很高。 回归、分类、聚类的区别 : 有监督学习 ...
,可以解释为这两个变量反 映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,将重复的变量(关 ...
------------------------------PCA简单使用------------------------------ 一:回顾PCA (一)主成分分析法是干什么用的? 数据降维,话句话说就是将数据地特征数量变少,但又不是简单地删除特征。 数据降维地目的可以是压缩数据,减少 ...
主成分分析 (principal component analysis, PCA) 是投影法的典型代表。投影法是指将高维的数据向低维投影,投影的方向可通过特征值分析等方法来确定。 具体来说,假设我们有一个具有 \(n\) 维特征的数据集,共有 \(m\) 个样本点,我们希望这 \(m\) 个样本 ...
主成分分析就是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。综合指标即为主成分。所得出的少数几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关。 因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量 ...
转:http://www.cnblogs.com/LeftNotEasy/archive/2011/01/08/lda-and-pca-machine-learning.html 版权声明: ...
一:引入问题 首先看一个表格,下表是某些学生的语文,数学,物理,化学成绩统计: 首先,假设这些科目成绩不相关,也就是说某一科目考多少分与其他科目没有关系,那么如何判断三个学生的优秀程度呢?首先我们一眼就能看出来,数学,物理,化学这三门课的成绩构成了这组数据的主成分(很显然,数学 ...