【文章推荐】大数据面试题(一)----HADOOP 面试题

原文：大数据面试题(一)----HADOOP 面试题

. 下列哪项通常是集群的最主要瓶颈 C A. CPU B. 网络 C. 磁盘IO D. 内存 . 下列哪项可以作为集群的管理工具 C A.Puppet B.Pdsh C.ClouderaManager D.Zookeeper . 下列哪个是Hadoop 运行的模式 ABC A. 单机版 B. 伪分布式 C. 完全分布式 . 列举几个hadoop 生态圈的组件并做简要描述 Zookeeper:是一 ...

2020-02-05 16:55 0 2348 推荐指数：

查看详情

大数据面试题总结

面试题总结: 分布式文件系统（Distributed File System）是指文件系统管理的物理存储资源不一定直接连接在本地节点上，而是通过计算机网络与节点相连。分布式文件系统的设计基于客户机/服务器模式。 [优点] 支持超大文件超大文件在这里指的是几百M，几百GB，甚至几TB大小 ...

大数据面试题

判断题： 1.如果 NameNode 意外终止，SecondaryNameNode 会接替它使集群继续工作。（错误）分析： SecondaryNameNode是帮助恢复，而不是替代 S ...

苏宁大数据面试题

1. hadoop 使用什么版本，CDH版本号，是5.3.6 。hadoop的版本是2.72，记住cdh的版本号和hadoop版本号不一样。2. flume是单节点采集数据还是多节点采集数据？flume是自定义框架还是用官方提供的框架？官方框架开发中有什么问题 ...

大数据面试题(一)

一、.hdfs写文件的步骤答案： (1)client向NameNode申请上传…/xxx.txt文件 (2)NN向client响应可以上传文件 (3)Client向NameNode申请Dat ...

大数据高频面试题

面试中的问题（重点）** 1. RDD的特性（RDD的解释）1.RDD可以看做是一些列partition所组成的2.RDD之间的依赖关系3.算子是作用在partition之上的4.分区器是作用在kv形式的RDD上5.partition提供的最佳计算位置,利于数据处理的本地化即计算向数据移动 ...

大数据面试题整理

1、fsimage和edit的区别？ 2、列举几个配置文件优化？ --发挥 3、datanode 首次加入 cluster 的时候 ...

大数据面试题

Mapreduce的理解？Mapreduce 的执行原理？ 1 Spark工作流程简述 Hadoop 中 job 和 task 之间的区别是什么 hive的使用，内外部表的区别，分区作用，UDF和Hive优化 Hive优化：看做 ...

BAT大数据面试题

和crc32之间多一个字节的数据：attributes(保存一些相关属性，比如是否压缩、压缩格式等等)； ...

原文：大数据面试题(一)----HADOOP 面试题

相关推荐

相关标签