原文:阿里大数据一次简单而失败的面试题回忆

一面 简单介绍一下自己以及自己做过的项目 Java HashMap 是不是线程安全的 为什么 请用 Java 写个单例模式 知道几种 GC 算法 如何实现一个高效的单项列表逆向输出 数据湖和数据仓库有什么区别 详细介绍下 Flink 的 Checkpoint 执行机制 分布式快照 算法题:寻找两个正序数组的中位数 二面 如何在两个进程间共享数据 线程呢 如何在 main 函数里面等待一个线程执行完 ...

2021-01-23 18:43 1 311 推荐指数:

查看详情

大数据面试题总结

面试题总结: 分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。分布式文件系统的设计基于客户机/服务器模式。 [优点] 支持超大文件 超大文件在这里指的是几百M,几百GB,甚至几TB大小 ...

Wed Nov 22 18:34:00 CST 2017 0 3933
大数据面试题

判断题: 1.如果 NameNode 意外终止,SecondaryNameNode 会接替它使集群继续工作。(错误)   分析:  SecondaryNameNode是帮助恢复,而不是替代 S ...

Sat Sep 15 00:34:00 CST 2018 0 1189
苏宁大数据面试题

1. hadoop 使用什么版本,CDH版本号,是5.3.6 。hadoop的版本是2.72,记住cdh的版本号和hadoop版本号不一样。2. flume是单节点采集数据还是多节点采集数据?flume是自定义框架还是用官方提供的框架?官方框架开发中有什么问题 ...

Sun Jun 16 21:13:00 CST 2019 0 515
大数据面试题(一)

一、.hdfs写文件的步骤 答案: (1)client向NameNode申请上传…/xxx.txt文件 (2)NN向client响应可以上传文件 (3)Client向NameNode申请Dat ...

Mon Feb 25 05:57:00 CST 2019 0 624
大数据高频面试题

面试中的问题(重点)** 1. RDD的特性(RDD的解释)1.RDD可以看做是一些列partition所组成的2.RDD之间的依赖关系3.算子是作用在partition之上的4.分区器是作用在kv形式的RDD上5.partition提供的最佳计算位置,利于数据处理的本地化即计算向数据移动 ...

Tue Sep 10 22:40:00 CST 2019 0 368
大数据面试题(一)----HADOOP 面试题

1. 下列哪项通常是集群的最主要瓶颈(C) A. CPU B. 网络 C. 磁盘IO D. 内存 2. 下列哪项可以作为集群的管理工具?(C) A.Puppet B.Pdsh C.Cl ...

Thu Feb 06 00:55:00 CST 2020 0 2348
大数据面试题及答案

1.给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?   假如每个url大小为10bytes,那么可以估计每个文件的大小为50 ...

Sat Sep 30 08:56:00 CST 2017 0 3069
大数据面试题

2.23. 我们开发job时,是否可以去掉reduce阶段。 可以。设置reduce数为0 即可。 2.24. datanode在什么情况下不会备份 datanode在强制关闭或者非正常断电不会备份。 ...

Thu Aug 23 01:33:00 CST 2018 0 1070
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM