原文:大數據技術之_32_大數據面試題_01_Hive 基本面試 + Hive 數據分析面試 + Flume + Kafka 面試

一 Hive 基本面試 什么是 metastore metastore 安裝方式有什么區別 什么是 Managed Table 跟 External Table 什么時候使用 Managed Table 跟 External Table hive 有哪些復合數據類型 hive 分區有什么好處 hive 分區跟分桶的區別 hive 如何動態分區 map join 優化手段 如何創建 bucket ...

2019-06-18 21:50 0 1773 推薦指數:

查看詳情

大數據面試題及答案

1.給定a、b兩個文件,各存放50億個url,每個url各占64字節,內存限制是4G,讓你找出a、b文件共同的url?   假如每個url大小為10bytes,那么可以估計每個文件的大小為50 ...

Sat Sep 30 08:56:00 CST 2017 0 3069
大數據面試題

2.23. 我們開發job時,是否可以去掉reduce階段。 可以。設置reduce數為0 即可。 2.24. datanode在什么情況下不會備份 datanode在強制關閉或者非正常斷電不會備份。 ...

Thu Aug 23 01:33:00 CST 2018 0 1070
大數據面試題總結

面試題總結: 分布式文件系統(Distributed File System)是指文件系統管理的物理存儲資源不一定直接連接在本地節點上,而是通過計算機網絡與節點相連。分布式文件系統的設計基於客戶機/服務器模式。 [優點] 支持超大文件 超大文件在這里指的是幾百M,幾百GB,甚至幾TB大小 ...

Wed Nov 22 18:34:00 CST 2017 0 3933
大數據面試題

判斷題: 1.如果 NameNode 意外終止,SecondaryNameNode 會接替它使集群繼續工作。(錯誤)   分析:  SecondaryNameNode是幫助恢復,而不是替代 SecondaryNameNode所做的不過是在文件系統中設置一個檢查點來幫助NameNode更好 ...

Sat Sep 15 00:34:00 CST 2018 0 1189
蘇寧大數據面試題

1. hadoop 使用什么版本,CDH版本號,是5.3.6 。hadoop的版本是2.72,記住cdh的版本號和hadoop版本號不一樣。2. flume是單節點采集數據還是多節點采集數據flume是自定義框架還是用官方提供的框架?官方框架開發中有什么問題 ...

Sun Jun 16 21:13:00 CST 2019 0 515
大數據面試題(一)

一、.hdfs寫文件的步驟 答案: (1)client向NameNode申請上傳…/xxx.txt文件 (2)NN向client響應可以上傳文件 (3)Client向NameNode申請Dat ...

Mon Feb 25 05:57:00 CST 2019 0 624
大數據高頻面試題

面試中的問題(重點)** 1. RDD的特性(RDD的解釋)1.RDD可以看做是一些列partition所組成的2.RDD之間的依賴關系3.算子是作用在partition之上的4.分區器是作用在kv形式的RDD上5.partition提供的最佳計算位置,利於數據處理的本地化即計算向數據移動 ...

Tue Sep 10 22:40:00 CST 2019 0 368
大數據面試題整理

1、fsimage和edit的區別? 2、列舉幾個配置文件優化? --發揮 3、datanode 首次加入 cluster 的時候 ...

Thu May 02 17:49:00 CST 2019 0 4262
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM