原文:Hadoop日記Day1---Hadoop介紹

一 Hadoop項目簡介 . Hadoop是什么 Hadoop是一個適合大數據的分布式存儲與計算平台。 作者:Doug Cutting Lucene,Nutch。 受Google三篇論文的啟發 . Hadoop核心項目 HDFS: Hadoop Distributed File System 分布式文件系統 MapReduce:並行計算框架 . Hadoop架構 . HDFS架構 主從結構 主節點 ...

2014-09-17 16:17 11 5865 推薦指數:

查看詳情

Hadoop日記Day12---MapReduce學習

一、MapReduce簡介 1.1MapReduce概述   MapReduce是一種分布式計算模型,由Google提出,主要用於搜索領域,解決海量數據的計算問題。MR由兩個階段組成:Map和Re ...

Wed Sep 24 03:18:00 CST 2014 6 3758
Hadoop日記Day9---HDFS的java訪問接口

一、搭建Hadoop 開發環境   我們在工作中寫完的各種代碼是在服務器中運行的,HDFS 的操作代碼也不例外。在開發階段,我們使用windows 下的eclipse 作為開發環境,訪問運行在虛擬機中的HDFS。也就是通過在本地的eclipse 中的java 代碼訪問遠程linux 中的hdfs ...

Sun Sep 21 00:21:00 CST 2014 2 2969
Hadoop日記Day18---MapReduce排序分組

本節所用到的數據下載地址為:http://pan.baidu.com/s/1bnfELmZ MapReduce的排序分組任務與要求   我們知道排序分組是MapReduce中Mapper端的第四步 ...

Wed Oct 08 22:37:00 CST 2014 1 5681
Hadoop日記Day11---主從節點接口分析

一、NameNode 的接口分析 1. NameNode本質   經過前面的學習,可以知道NameNode 本身就是一個java 進程。觀察RPC.getServer()方法的第一個參數,發現是t ...

Sun Sep 21 01:32:00 CST 2014 4 1558
Hadoop日記系列目錄

  下面是Hadoop日記系列的目錄,由於目前時間不是很充裕,以后的更新的速度會變慢,會按照一星期發布一期的原則進行,希望能和大家相互學習、交流。   目錄安排   1> Hadoop日記Day1---Hadoop介紹   2> Hadoop日記Day2---虛擬機中搭建 ...

Wed Oct 15 16:18:00 CST 2014 5 2082
Hadoop日記Day17---計數器、map規約、分區學習

一、Hadoop計數器 1.1 什么是Hadoop計數器   Haoop是處理大數據的,不適合處理小數據,有些大數據問題是小數據程序是處理不了的,他是一個高延遲的任務,有時處理一個大數據需要花費好幾個小時這都是正常的。下面我們說一下Hadoop計數器,Hadoop計數器就相當於我們的日志 ...

Wed Oct 08 04:11:00 CST 2014 1 2347
Hadoop Yarn源碼 - day1

Hadoop 2.6.0下面的關於Yarn工程,如下所示,主要有以下七個module: hadoop-yarn-api:和外部平台交互的接口 hadoop-yarn-applications hadoop ...

Tue Sep 13 04:04:00 CST 2016 0 1784
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM