【文章推薦】大數據相關的面試題（摘自網絡）hbase,kafka,spark

原文：大數據相關的面試題（摘自網絡）hbase,kafka,spark

.講講你做的過的項目, 項目里有哪些難點重點呢 kafkaDirect ES hive kafka producer 難點值得一提的有兩點： .rdd中用到外部變量的時候如何處理 .廣播變量的更新 rdd處理kafka讀過來的數據，這些數據引用外部的class來進行規則解析，規則的更新后怎么辦 .講講多線程吧，要是你，你怎么實現一個線程池呢Executor接口提供了execute 方法將任務 ...

2019-01-18 09:26 0 713 推薦指數：

查看詳情

大數據面試題總結

面試題總結: 分布式文件系統（Distributed File System）是指文件系統管理的物理存儲資源不一定直接連接在本地節點上，而是通過計算機網絡與節點相連。分布式文件系統的設計基於客戶機/服務器模式。 [優點] 支持超大文件超大文件在這里指的是幾百M，幾百GB，甚至幾TB大小 ...

大數據面試題

判斷題： 1.如果 NameNode 意外終止，SecondaryNameNode 會接替它使集群繼續工作。（錯誤）分析： SecondaryNameNode是幫助恢復，而不是替代 S ...

蘇寧大數據面試題

1. hadoop 使用什么版本，CDH版本號，是5.3.6 。hadoop的版本是2.72，記住cdh的版本號和hadoop版本號不一樣。2. flume是單節點采集數據還是多節點采集數據？flume是自定義框架還是用官方提供的框架？官方框架開發中有什么問題 ...

大數據面試題(一)

一、.hdfs寫文件的步驟答案： (1)client向NameNode申請上傳…/xxx.txt文件 (2)NN向client響應可以上傳文件 (3)Client向NameNode申請Dat ...

大數據高頻面試題

面試中的問題（重點）** 1. RDD的特性（RDD的解釋）1.RDD可以看做是一些列partition所組成的2.RDD之間的依賴關系3.算子是作用在partition之上的4.分區器是作用在kv形式的RDD上5.partition提供的最佳計算位置,利於數據處理的本地化即計算向數據移動 ...

大數據面試題(一)----HADOOP 面試題

1. 下列哪項通常是集群的最主要瓶頸（C） A. CPU B. 網絡 C. 磁盤IO D. 內存 2. 下列哪項可以作為集群的管理工具？（C） A.Puppet B.Pdsh C.ClouderaManager D.Zookeeper 3. 下列哪個是Hadoop 運行的模式 ...

大數據面試題整理

1、fsimage和edit的區別？ 2、列舉幾個配置文件優化？ --發揮 3、datanode 首次加入 cluster 的時候 ...

大數據面試題

Mapreduce的理解？Mapreduce 的執行原理？ 1 Spark工作流程簡述 Hadoop 中 job 和 task 之間的區別是什么 hive的使用，內外部表的區別，分區作用，UDF和Hive優化 Hive優化：看做 ...

原文：大數據相關的面試題（摘自網絡）hbase,kafka,spark

相關推薦

相關標簽