花费 7 ms
机器学习之寻找KMeans的最优K

  K-Means聚类算法是最为经典的,同时也是使用最为广泛的一种基于划分的聚类算法,它属于基于距离的无监督聚类算法。KMeans算法简单实用,在机器学习算法中占有重要的地位。对于KMeans算法而言 ...

Tue Jun 28 05:23:00 CST 2016 1 4989
使用mahout fpgrowth算法求关联规则

  首先,这篇文章的内容大部分取自国外一篇博客Finding association rules with Mahout Frequent Pattern Mining,写这个出于几个原因,一 原文是英文的;二该博客貌似还被墙了,反正我是用了goagent才看到的;三 我简化了其实验内容 ...

Sat Jul 06 19:38:00 CST 2013 7 4492
(转)Mahout Kmeans Clustering 学习

一、Mahout命令使用 合成控制的数据集 synthetic_control.data 可以从 此处下载,总共由600行X60列double型的数据组成, 意思是有600个元组,每个元组是一个时间序列。 1. 把数据拷到集群上,放到kmeans/目录 ...

Fri Apr 18 23:56:00 CST 2014 0 4950
FuzzyKmeans,mahout实现

首先介绍一下,FuzzyKMeans算法的主要思想。 模糊 C 均值聚类(FCM),即众所周知的模糊 ISODATA,是用隶属度确定每个数据点属于某个聚类的程度的一种聚类算法。1973 年,Bezd ...

Thu May 10 17:15:00 CST 2012 0 3463
利用LDA进行文本聚类(hadoop, mahout)

项目原理概述 利用sqoop将数据从MySQL导入到HDFS中,利用mahout的LDA的cvb实现对输入数据进行聚类,并将结果更新到数据库中。数据流向图如下 mahout算法分析输入数据格式为<IntegerWritable, VectorWritable> ...

Thu Jul 03 00:11:00 CST 2014 0 2390

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM