原文:大数据面试题以及答案整理(一)

kafka的message包括哪些信息一个Kafka的Message由一个固定长度的header和一个变长的消息体body组成header部分由一个字节的magic 文件格式 和四个字节的CRC 用于判断body消息体是否正常 构成。当magic的值为 的时候,会在magic和crc 之间多一个字节的数据:attributes 保存一些相关属性,比如是否压缩 压缩格式等等 如果magic的值为 , ...

2018-10-29 09:15 0 824 推荐指数:

查看详情

大数据面试题答案

1.给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?   假如每个url大小为10bytes,那么可以估计每个文件的大小为50 ...

Sat Sep 30 08:56:00 CST 2017 0 3069
大数据面试题整理

1、fsimage和edit的区别? 2、列举几个配置文件优化? --发挥 3、datanode 首次加入 cluster 的时候 ...

Thu May 02 17:49:00 CST 2019 0 4262
大数据面试题130道及答案整理 1-15

1、HashMap 和 Hashtable 区别 HashMap和Hashtable都实现了Map接口,但决定用哪一个之前先要弄清楚它们之间的分别。主要的区别有:线程安全性,同步(syn ...

Tue Aug 11 22:06:00 CST 2020 0 5440
大数据面试题(一)----HADOOP 面试题

1. 下列哪项通常是集群的最主要瓶颈(C) A. CPU B. 网络 C. 磁盘IO D. 内存 2. 下列哪项可以作为集群的管理工具?(C) A.Puppet B.Pdsh C.Cl ...

Thu Feb 06 00:55:00 CST 2020 0 2348
大数据面试题总结

面试题总结: 分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。分布式文件系统的设计基于客户机/服务器模式。 [优点] 支持超大文件 超大文件在这里指的是几百M,几百GB,甚至几TB大小 ...

Wed Nov 22 18:34:00 CST 2017 0 3933
大数据面试题

判断题: 1.如果 NameNode 意外终止,SecondaryNameNode 会接替它使集群继续工作。(错误)   分析:  SecondaryNameNode是帮助恢复,而不是替代 S ...

Sat Sep 15 00:34:00 CST 2018 0 1189
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM