从样本相似性到图 根据我们一般的理解,聚类是将相似的样本归为一类,或者说使得同类样本相似度尽量高,异类样本相似性尽量低。无论如何,我们需要一个方式度量样本间的相似性。常用的方式就是引入各种度量,如欧氏距离、余弦相似度、高斯度量等等。 度量的选择提现了你对样本或者业务的理解。比如说如果你要比 ...
广义上来说,任何在算法中用到SVD 特征值分解的,都叫SpectralAlgorithm。顺便说一下,对于任意矩阵只存在奇异值分解,不存在特征值分解。对于正定的对称矩阵,奇异值就是特征值,奇异向量就是特征向量。 传统的聚类算法,如K Means EM算法都是建立在凸球形样本空间上,当样本空间不为凸时,算法会陷入局部最优,最终结果受初始参数的选择影响比较大。而谱聚类可以在任意形状的样本空间上聚类,且 ...
2012-08-15 10:18 1 7214 推荐指数:
从样本相似性到图 根据我们一般的理解,聚类是将相似的样本归为一类,或者说使得同类样本相似度尽量高,异类样本相似性尽量低。无论如何,我们需要一个方式度量样本间的相似性。常用的方式就是引入各种度量,如欧氏距离、余弦相似度、高斯度量等等。 度量的选择提现了你对样本或者业务的理解。比如说如果你要比 ...
什么是谱聚类? 就是找到一个合适的切割点将图进行切割,核心思想就是: 使得切割的边的权重和最小,对于无向图而言就是切割的边数最少,如上所示。但是,切割的时候可能会存在局部最优,有以下两种方法: (1)RatioCut:核心是要求划分出来的子图的节点数尽可能的大 分母变为子图 ...
1. 谱聚类 给你博客园上若干个博客,让你将它们分成K类,你会怎样做?想必有很多方法,本文要介绍的是其中的一种——谱聚类。 聚类的直观解释是根据样本间相似度,将它们分成不同组。谱聚类的思想是将样本看作顶点,样本间的相似度看作带权的边,从而将聚类问题转为图分割问题:找到一种图 ...
前言:以前只是调用过谱聚类算法,我也不懂为什么各家公司都问我一做文字检测的这个算法具体咋整的,没整明白还给我挂了哇擦嘞?讯飞还以这个理由刷本宝,今天一怒把它给整吧清楚了,下次谁再问来!说不晕你算我输! 一、解释: 谱聚类是一种基于图论的算法,主要思想是把所有的数据看做空间中的点,这些点 ...
聚类后: ...
引入 聚类算法一般可以分为两类: Compactness。代表的算法有 K-means,GMM 等。但这类算法只能处理凸集,为了处理非凸的样本集,必须引⼊核技巧。 Connectivity。这类以 spectral clustering 为代表。 举个例子,将下述 ...
目录: 1、问题描述 2、问题转化 3、划分准则 4、总结 1、问题描述 谱聚类(Spectral Clustering, SC)是一种基于图论的聚类方法——将带权无向图划分为两个或两个以上的最优子图(sub-Graph),使子图内部尽量相似,而子图间距离尽量距离较远,以达到 ...
本文将对谱聚类的知识进行一些总结。目的在于记录自己的学习经历,当作自己的笔记来写。写得不好的地方欢迎交流指正。谱聚类是一种非常流行的聚类算法,它不需要对簇的类型有很强的假设,可以聚类任何形状的数据。 一、简要介绍 由于网上有许多的关于谱聚类的介绍,所以我这里只是简要介绍 ...