花费 8 ms
Mahout介绍和简单应用

Mahout学习(主要学习内容是Mahout中推荐部分的ItemCF、UserCF、Hadoop集群部署运行) 1、Mahout是什么? Mahout是一个算法库,集成了很多算法。 ...

Sun Jun 25 01:09:00 CST 2017 4 28694
Mahout安装与配置

Mahout是Hadoop的一种高级应用。运行Mahout需要提前安装好Hadoop。Hadoop的安装网上很多,并不复杂,这里不再讲述,接下来阐述怎么安装Mahout。1:下载二进制解压安装。到ht ...

Sat Mar 16 00:18:00 CST 2013 8 29854
大数据学习脑图以及7个入门教程!

近些年,大数据的火热可谓是技术人都知道啊,很多人呢,也想学习大数据相关,所以,这里分享几个大数据脑图,希望可以让你清楚明白从哪里入门大数据,知道该学习以及掌握哪些知识点; 大数据相关脑图: ...

Wed Apr 19 00:54:00 CST 2017 1 6838
零基础学习Mahout之一:搭建单机环境

一、Mahout是什么? Mahout是Apache的一个开源项目(http://mahout.apache.org/),提供了机器学习领域的若干经典算法,以便开发人员快速构建机器学习和数据挖掘 ...

Thu Aug 07 09:27:00 CST 2014 1 7663
聚类之MinHash

最小哈希法 最小哈希原理介绍 MinHash是基于Jaccard Index相似度(海量数据不可行)的算法,一种降维的方法A,B 两个集合:A = {s1, s3, s6, s8, s9} ...

Thu Dec 20 20:39:00 CST 2012 0 9088
Mahout-DistanceMeasure (数据点间的距离计算方法)

  在分类聚类算法,推荐系统中,常要用到两个输入变量(通常是特征向量的形式)距离的计算,即相似性度量.不同相似性度量对于算法的结果,有些时候,差异很大.因此,有必要根据输入数据的特征,选择一种合适的相 ...

Thu Jun 07 23:23:00 CST 2012 0 9568
Mahout聚类分析

聚类分析 什么是聚类分析? 聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所 ...

Tue May 08 07:56:00 CST 2012 0 7908
用 Mahout 和 Elasticsearch 实现推荐系统

原文地址 本文内容 软件 步骤 控制相关性 总结 参考资料 本文介绍如何用带 Apache Mahout 的 MapR Sandbox for Hadoop 和 Ela ...

Tue May 24 18:44:00 CST 2016 0 3620
Mahout源码分析:并行化FP-Growth算法

  FP-Growth是一种常被用来进行关联分析,挖掘频繁项的算法。与Aprior算法相比,FP-Growth算法采用前缀树的形式来表征数据,减少了扫描事务数据库的次数,通过递归地生成条件FP-tre ...

Sat Sep 13 22:35:00 CST 2014 4 3144
Mahout——Canopy Clustering

查看原文 聚类是机器学习里很重要的一类方法,基本原则是将“性质相似”(这里就有相似的标准问题,比如是基于概率分布模型的相似性又或是基于距离的相似性)的对象尽可能的放在一个Cluster中而不同 ...

Fri Jun 08 00:32:00 CST 2012 0 4994

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM