原文:【面試題】大數據開發崗位

Linux 使用 linux 命令從字符串 apple .com 中提取 apple 將 apple .com 替換為 apple qq.com 配置crontab 定時調度,每小時 分執行 data checklog.sh 腳本 數據庫 Oracle 數據庫中,通過 訪問能夠以最快的方式訪問表中的一行數據 A 主鍵 B Rowid C 唯一索引 D 整表掃描 Oracle數據庫中,下面 可以作為 ...

2020-09-03 22:11 0 523 推薦指數:

查看詳情

面試題大數據開發崗位

某公司面試題: 1、闡述數據庫的三大范式? 2、Linux 自帶的常用命令舉例至少20個? 3、Spark 有哪些聚合類的算子,我們應該盡量避免什么類型的算子? 4、Hive 和 HBase 的區別? 5、你了解設計模式嗎?寫出你知道的設計模式。 6、常見的GC算法 ...

Fri Aug 28 20:54:00 CST 2020 0 467
面試題大數據開發第1輪面試

面試總結: 1、HDFS小文件 小文件的產生原因 1) 數據本身的特點:比如我們在 HDFS 上存儲大量的圖片、短視頻、短音頻等文件,這些文件本身較小,達不到一個block的大小,而且數量眾多。 2) MapReduce產生:例如使用查詢一張含有海量數據的表,然后存儲在另外一張表中,而這個查詢 ...

Sat Aug 29 23:29:00 CST 2020 0 724
大數據面試題總結

面試題總結: 分布式文件系統(Distributed File System)是指文件系統管理的物理存儲資源不一定直接連接在本地節點上,而是通過計算機網絡與節點相連。分布式文件系統的設計基於客戶機/服務器模式。 [優點] 支持超大文件 超大文件在這里指的是幾百M,幾百GB,甚至幾TB大小 ...

Wed Nov 22 18:34:00 CST 2017 0 3933
大數據面試題

判斷題: 1.如果 NameNode 意外終止,SecondaryNameNode 會接替它使集群繼續工作。(錯誤)   分析:  SecondaryNameNode是幫助恢復,而不是替代 S ...

Sat Sep 15 00:34:00 CST 2018 0 1189
蘇寧大數據面試題

1. hadoop 使用什么版本,CDH版本號,是5.3.6 。hadoop的版本是2.72,記住cdh的版本號和hadoop版本號不一樣。2. flume是單節點采集數據還是多節點采集數據?flume是自定義框架還是用官方提供的框架?官方框架開發中有什么問題 ...

Sun Jun 16 21:13:00 CST 2019 0 515
大數據面試題(一)

一、.hdfs寫文件的步驟 答案: (1)client向NameNode申請上傳…/xxx.txt文件 (2)NN向client響應可以上傳文件 (3)Client向NameNode申請Dat ...

Mon Feb 25 05:57:00 CST 2019 0 624
大數據高頻面試題

面試中的問題(重點)** 1. RDD的特性(RDD的解釋)1.RDD可以看做是一些列partition所組成的2.RDD之間的依賴關系3.算子是作用在partition之上的4.分區器是作用在kv形式的RDD上5.partition提供的最佳計算位置,利於數據處理的本地化即計算向數據移動 ...

Tue Sep 10 22:40:00 CST 2019 0 368
大數據面試題(一)----HADOOP 面試題

1. 下列哪項通常是集群的最主要瓶頸(C) A. CPU B. 網絡 C. 磁盤IO D. 內存 2. 下列哪項可以作為集群的管理工具?(C) A.Puppet B.Pdsh C.Cl ...

Thu Feb 06 00:55:00 CST 2020 0 2348
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM