原文:大数据相关技术原理资料整理(hdfs, spark, hbase, kafka, zookeeper, redis, hive, flink, k8s, OpenTSDB, InfluxDB, yarn)

hdfs: hdfs官方文档 深入理解HDFS的架构和原理 https: blog.csdn.net kezhong wxl article details HDFS原理解析 总体架构,读写操作流程 http: www.cnblogs.com duanxz p .html 经典漫画讲解HDFS原理 https: blog.csdn.net scdxmoe article details 独家 一文 ...

2019-05-08 11:34 0 616 推荐指数:

查看详情

大数据组件原理总结-Hadoop、HbaseKafkaZookeeperSpark

Hadoop原理 分为HDFSYarn两个部分。HDFS有Namenode和Datanode两个部分。每个节点占用一个电脑。Datanode定时向Namenode发送心跳包,心跳包中包含Datanode的校验等信息,用来监控Datanode。HDFS数据分为块,默认为64M每个块信息 ...

Tue Jun 30 18:11:00 CST 2015 0 20186
Docker搭建大数据集群 Hadoop Spark HBase Hive Zookeeper Scala

Docker搭建大数据集群 (1)本机系统设置 电脑设置虚拟缓存(设置为自动管理) 虚拟机设置内存和CPU 内存设置为8G(或以上) CPU稍微设置高一点(三个虚拟化能开就开) 虚拟机系统配置阿里源 虚拟机更新包 (2)安装Docker 移除 ...

Sun Feb 20 00:18:00 CST 2022 0 1972
大数据技术】Hadoop三大组件架构原理HDFS-YARN-MapReduce)

目前,Hadoop还只是数据仓库产品的一个补充,和数据仓库一起构建混搭架构为上层应用联合提供服务。 Hadoop集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起。 (1)HDFS集群:负责海量数据的存储,集群中的角色主要有 NameNode ...

Tue Dec 25 19:29:00 CST 2018 0 703
大数据学习系列之九---- Hive整合SparkHBase以及相关测试

前言 在之前的大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建 中介绍了集群的环境搭建,但是在使用hive进行数据查询的时候会非常的慢,因为hive默认使用的引擎是MapReduce。因此就将spark作为hive的引擎来对hbase进行 ...

Sun Jan 21 05:24:00 CST 2018 0 4385
大数据相关的面试题(摘自网络)hbase,kafka,spark

1.讲讲你做的过的项目, 项目里有哪些难点重点呢? kafkaDirect ES /hive kafka producer 难点值得一提的有两点: 1.rdd中用到外部变量的时候如何处理 2.广播变量的更新 rdd处理kafka读过来的数据,这些数据引用外部的class来进行 ...

Fri Jan 18 17:26:00 CST 2019 0 713
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM