花費 78 ms
機器學習之尋找KMeans的最優K

  K-Means聚類算法是最為經典的,同時也是使用最為廣泛的一種基於划分的聚類算法,它屬於基於距離的無監督聚類算法。KMeans算法簡單實用,在機器學習算法中占有重要的地位。對於KMeans算法而言 ...

Tue Jun 28 05:23:00 CST 2016 1 4989
使用mahout fpgrowth算法求關聯規則

  首先,這篇文章的內容大部分取自國外一篇博客Finding association rules with Mahout Frequent Pattern Mining,寫這個出於幾個原因,一 原文是英文的;二該博客貌似還被牆了,反正我是用了goagent才看到的;三 我簡化了其實驗內容 ...

Sat Jul 06 19:38:00 CST 2013 7 4492
(轉)Mahout Kmeans Clustering 學習

一、Mahout命令使用 合成控制的數據集 synthetic_control.data 可以從 此處下載,總共由600行X60列double型的數據組成, 意思是有600個元組,每個元組是一個時間序列。 1. 把數據拷到集群上,放到kmeans/目錄 ...

Fri Apr 18 23:56:00 CST 2014 0 4950
FuzzyKmeans,mahout實現

首先介紹一下,FuzzyKMeans算法的主要思想。 模糊 C 均值聚類(FCM),即眾所周知的模糊 ISODATA,是用隸屬度確定每個數據點屬於某個聚類的程度的一種聚類算法。1973 年,Bezd ...

Thu May 10 17:15:00 CST 2012 0 3463
利用LDA進行文本聚類(hadoop, mahout)

項目原理概述 利用sqoop將數據從MySQL導入到HDFS中,利用mahout的LDA的cvb實現對輸入數據進行聚類,並將結果更新到數據庫中。數據流向圖如下 mahout算法分析輸入數據格式為<IntegerWritable, VectorWritable> ...

Thu Jul 03 00:11:00 CST 2014 0 2390

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM