原文:spark 源码分析之十五 -- Spark内存管理剖析

本篇文章主要剖析Spark的内存管理体系。 在上篇文章spark 源码分析之十四 broadcast 是如何实现的 中对存储相关的内容没有做过多的剖析,下面计划先剖析Spark的内存机制,进而进入内存存储,最后再剖析磁盘存储。本篇文章主要剖析内存管理机制。 整体介绍 Spark内存管理相关类都在 spark core 模块的 org.apache.spark.memory 包下。 文档对这个包的解 ...

2019-07-17 19:57 0 506 推荐指数:

查看详情

spark 源码分析之十六 -- Spark内存存储剖析

上篇spark 源码分析十五 -- Spark内存管理剖析 讲解了Spark内存管理机制,主要是MemoryManager的内容。跟Spark内存管理机制最密切相关的就是内存存储,本篇文章主要介绍Spark内存存储。 总述 跟内存存储的相关类的关系 ...

Fri Jul 19 05:49:00 CST 2019 0 515
spark 源码分析之二十二-- Task的内存管理

问题的提出 本篇文章将回答如下问题: 1. spark任务在执行的时候,其内存是如何管理的? 2. 堆内内存的寻址是如何设计的?是如何避免由于JVM的GC的存在引起的内存地址变化的?其内部的内存缓存池回收机制是如何设计的? 3. 堆外和堆内内存分别是通过什么来分配的?其数据的偏移量 ...

Thu Aug 01 07:43:00 CST 2019 0 547
spark 源码分析之十三 -- SerializerManager剖析

对SerializerManager的说明: 它是为各种Spark组件配置序列化,压缩和加密的组件,包括自动选择用于shuffle的Serializer。spark中的数据在network IO 或 local disk IO传输过程中。都需要序列化。其默认的 Serializer ...

Tue Jul 16 04:03:00 CST 2019 2 351
spark 源码分析之十七 -- Spark磁盘存储剖析

上篇文章 spark 源码分析之十六 -- Spark内存存储剖析 主要剖析Spark内存存储。本篇文章主要剖析磁盘存储。 总述 磁盘存储相对比较简单,相关的类关系图如下: 我们先从依赖类 DiskBlockManager 剖析 ...

Mon Jul 22 04:08:00 CST 2019 0 442
spark 源码分析之五--Spark RPC剖析之创建NettyRpcEnv

在前面源码剖析介绍中,spark 源码分析之二 -- SparkContext 的初始化过程 中的SparkEnv和 spark 源码分析之四 -- TaskScheduler的创建和启动过程 中的ClientApp启动过程中,都涉及到了Spark的内置RPC的知识。本篇专门把RPC 拿出来剖析 ...

Wed Jul 03 06:19:00 CST 2019 0 526
Spark十五)SparkCore的源码解读

一、启动脚本分析 独立部署模式下,主要由master和slaves组成,master可以利用zk实现高可用性,其driver,work,app等信息可以持久化到zk上;slaves由一台至多台主机构成。Driver通过向Master申请资源获取运行环境。 启动master和slaves主要 ...

Mon Jul 16 05:47:00 CST 2018 0 1030
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM