原文:spark精华面试题

driver的功能是什么 一个Spark作业运行时包括一个Driver进程,也是作业的主进程,具有main函数,并且有SparkContext的实例,是程序的人口点 功能:负责向集群申请资源,向master注册信息,负责了作业的调度,,负责作业的解析 生成Stage并调度Task到Executor上。包括DAGScheduler,TaskScheduler。 spark的有几种部署模式,每种模式 ...

2018-05-18 16:23 0 9019 推荐指数:

查看详情

spark精华面试题

spark精华面试题 1、driver的功能是什么?   1)一个Spark作业运行时包括一个Driver进程,也是作业的主进程,具有main函数,并且有SparkContext的实例,是程序的人口点;  2)功能:负责向集群申请资源,向master注册信息,负责了作业的调度,负责作业的解析 ...

Thu Apr 23 01:58:00 CST 2020 0 6480
Spark面试题(二)

一、spark streaming和storm有何区别? 一个实时毫秒,一个准实时亚秒,不过storm的吞吐率比较低。 二、spark有哪些组件? Master:管理集群和节点,不参与计算。 Worker:计算节点,进程本身不参与计算,和master汇报。 Driver:运行 ...

Mon Feb 25 05:52:00 CST 2019 0 849
Spark面试题(四)

Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——Spark程序开发调优 ...

Mon Nov 08 04:17:00 CST 2021 0 216
Spark面试题(二)

首发于我的个人博客:Spark面试题(二) 1、Spark有哪两种算子? Transformation(转化)算子和Action(执行)算子。 2、Spark有哪些聚合类的算子,我们应该尽量避免什么类型的算子? 在我们的开发过程中,能避免则尽可能避免使用reduceByKey ...

Fri Oct 29 06:05:00 CST 2021 0 102
spark面试题-1

原文链接:https://blog.csdn.net/Lwj879525930/article/details/82559596 1.spark中的RDD是什么,有哪些特性? 答:RDD(Resilient Distributed Dataset)叫做分布式数据集,是spark中最 ...

Sat Nov 16 05:45:00 CST 2019 0 545
Spark面试题

Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——Spark程序开发调优 ...

Wed Oct 27 07:39:00 CST 2021 0 913
04:运维精华面试题

1.1 什么是运维?   1、什么是运维       1. 运维是指大型组织已经建立好的网络软硬件的维护,就是要保证业务的上线与运作的正常。       2. 在他运转的过程中,对他进行维护,他 ...

Tue Dec 03 16:56:00 CST 2019 1 258
Spark面试题

RDD怎么理解? RDD 是 Spark 的灵魂,也称为弹性分布式数据集。一个 RDD 代表一个可以被分区的只读数据集。RDD 内部可以有许多分区(partitions),每个分区又拥有大量的记录(records)。Rdd的五个特征: 1. dependencies: 建立 RDD 的依赖关系 ...

Fri Mar 15 00:12:00 CST 2019 0 1866
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM