海量数据
Apache Hadoop Goes Realtime at Facebook(译) 数据统计 数据挖掘
K-Means 算法(聚类)
|
hadoop2
hadoop 介绍 管理
hadoop SecondaryNameNode和NameNode hadoop 根据SecondaryNameNode恢复Namenode
Facebook团队关于Hadoop/HBase在SSD上的实验和讨论
调优 原理实现
Hadoop开发常用的InputFormat和OutputFormat |
hive 应用 管理
hive 中 Order by, Sort by ,Dristribute by,Cluster By 的作用和用法 hive lateral view语句(翻译自Hive wiki)
优化
|
pig 介绍入门 管理 教程 zookeeper
hbase
|