Hadoop簡介和歷史 Hadoop架構體系 Master和Slave節點 數據分析面臨的問題和Hadoop思想 由於工作原因,必須學習和深入一下Hadoop,特此記錄筆記。 什么是hadoop? Apache Hadoop是一款支持數據密集型 ...
一 Hadoop簡介 Hadoop最早起源於Nutch。Nutch是一個開源的網絡搜索引擎,由Doug Cutting於 年創建。Nutch的設計目標是構建一個大型的全網搜索引擎,包括網頁抓取 索引,查詢等功能,隨着網頁抓取數量的增加,遇到嚴重的可擴展問題,即不能解決數十億網頁的存儲和索引的問題,之后,Google發布的兩篇論文 The Google File System和MapReduce: ...
2013-08-13 17:20 1 4889 推薦指數:
Hadoop簡介和歷史 Hadoop架構體系 Master和Slave節點 數據分析面臨的問題和Hadoop思想 由於工作原因,必須學習和深入一下Hadoop,特此記錄筆記。 什么是hadoop? Apache Hadoop是一款支持數據密集型 ...
一,架構 二、名詞解釋 (一)NameNode(簡稱NN),Hadoop的主節點,負責偵聽節點是否活躍,對外開放接口等。在未來的大數據處理過程中,由於訪問量和節點數量的不斷增多,需要該節點的處理能力較高,因此從集群搭建的角度,建議該節點的CPU配置較高 ...
Hadoop2相比較於Hadoop1.x來說,HDFS的架構與MapReduce的都有較大的變化,且速度上和可用性上都有了很大的提高,Hadoop2中有兩個重要的變更: (1)HDFS的NameNode可以以集群的方式布署,增強了NameNodes的水平擴展能力和高可用性,分別是:HDFS ...
今天跟一個朋友在討論hadoop體系架構,從當下流行的Hadoop+HDFS+MapReduce+Hbase+Pig+Hive+Spark+Storm開始一直講到HDFS的底層實現,MapReduce的模型計算,到一個雲盤如何實現,再到Google分布式史上那最偉大的三篇文章。 這幾 ...
Prometheus簡介和架構 Prometheus 是由 SoundCloud 開源監控告警解決方案。架構圖如下: 如上圖,Prometheus主要由以下部分組成: Prometheus Server:用於抓取和存儲時間序列化數據 Exporters:主動拉取數據的插件 ...
最近項目中遇到不少NIO相關知識,之前對這塊接觸得較少,算是我的一個盲區,打算花點時間學習,簡單做一點個人學習總結。 簡介 NIO(New IO)是JDK1.4以后推出的全新IO API,相比傳統IO方式NIO采用了全新的底層I/O模型。傳統IO的設計概念是面向流,而NIO則是面向塊。簡單點說 ...
一、ELK簡介 ELK Stack是軟件集合Elasticsearch、Logstash、Kibana的簡稱,由這三個軟件及其相關的組件可以打造大規模日志實時處理系統。 Elasticsearch 是一個基於 Lucene 的、支持全文索引的分布式存儲和索引引擎,主要負責將日志索引並存 ...
1. Spring框架簡介(以下這段話可用於面試求職) Spring為JavaEE開發提供了一個輕量級的解決方案,主要表現為, IOC(或者叫做DI)的核心機制,提供了bean工廠(Spring容器),降低了業務對象替換的復雜性,提高了組件之間的解耦。 AOP的將一些通用任務,如安全 ...