在Mahout实现的机器学习算法见下表
| 算法类 |
算法名 |
中文名 |
| 分类算法 |
Logistic Regression |
逻辑回归 |
| Bayesian |
贝叶斯 |
|
| SVM |
支持向量机 |
|
| Perceptron |
感知器算法 |
|
| Neural Network |
神经网络 |
|
| Random Forests |
随机森林 |
|
| Restricted Boltzmann Machines |
有限波尔兹曼机 |
|
| 聚类算法 |
Canopy Clustering |
Canopy聚类 |
| K-means Clustering |
K均值算法 |
|
| Fuzzy K-means |
模糊K均值 |
|
| Expectation Maximization |
EM聚类(期望最大化聚类) |
|
| Mean Shift Clustering |
均值漂移聚类 |
|
| Hierarchical Clustering |
层次聚类 |
|
| Dirichlet Process Clustering |
狄里克雷过程聚类 |
|
| Latent Dirichlet Allocation |
LDA聚类 |
|
| Spectral Clustering |
谱聚类 |
|
| 关联规则挖掘 |
Parallel FP Growth Algorithm |
并行FP Growth算法 |
| 回归 |
Locally Weighted Linear Regression |
局部加权线性回归 |
| 降维/维约简 |
Singular Value Decomposition |
奇异值分解 |
| Principal Components Analysis |
主成分分析 |
|
| Independent Component Analysis |
独立成分分析 |
|
| Gaussian Discriminative Analysis |
高斯判别分析 |
|
| 进化算法 |
并行化了Watchmaker框架 |
|
| 推荐/协同过滤 |
Non-distributed recommenders |
Taste(UserCF, ItemCF, SlopeOne) |
| Distributed Recommenders |
ItemCF |
|
| 向量相似度计算 |
RowSimilarityJob |
计算列间相似度 |
| VectorDistanceJob |
计算向量间距离 |
|
| 非Map-Reduce算法 |
Hidden Markov Models |
隐马尔科夫模型 |
| 集合方法扩展 |
Collections |
扩展了java的Collections类 |
Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。
