原文:Spark学习之路 (十三)SparkCore的调优之资源调优JVM的基本架构

一 JVM的结构图 . Java内存结构 JVM内存结构主要有三大块:堆内存 方法区和栈。 堆内存是JVM中最大的一块由年轻代和老年代组成,而年轻代内存又被分成三部分,Eden空间 From Survivor空间 To Survivor空间,默认情况下年轻代按照 : : 的比例来分配 方法区存储类信息 常量 静态变量等数据,是线程共享的区域,为与Java堆区分,方法区还有一个别名Non Heap ...

2018-04-30 15:29 3 4252 推荐指数:

查看详情

Spark学习之路 (十二)SparkCore资源

摘抄自:https://tech.meituan.com/spark-tuning-basic.html 一、概述 在开发完Spark作业之后,就该为作业配置合适的资源了。Spark资源参数,基本都可以在spark-submit命令中作为参数设置。很多Spark初学者,通常不知道该设置 ...

Mon Apr 30 23:11:00 CST 2018 1 4744
Spark学习之路 (十四)SparkCore资源JVM的GC垃圾收集器

一、概述 垃圾收集 Garbage Collection 通常被称为“GC”,它诞生于1960年 MIT 的 Lisp 语言,经过半个多世纪,目前已经十分成熟了。 jvm 中,程序计数器、虚拟机栈、本地方法栈都是随线程而生随线程而灭,栈帧随着方法的进入和退出做入栈和出栈操作,实现了自动的内存 ...

Tue May 01 00:07:00 CST 2018 0 4283
Spark学习之路 (八)SparkCore之开发

摘抄自:https://tech.meituan.com/spark-tuning-basic.html 前言 在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算 ...

Thu Apr 26 03:07:00 CST 2018 0 8581
Spark学习之路 (九)SparkCore之数据倾斜

摘抄自:https://tech.meituan.com/spark-tuning-pro.html 数据倾斜 概述 有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜,就是使用各种技术方案解决不同类型的数据倾斜问题 ...

Thu Apr 26 03:16:00 CST 2018 0 6882
spark 资源参数

资源参数 了解完了Spark作业运行的基本原理之后,对资源相关的参数就容易理解了。所谓的Spark资源参数,其实主要就是对Spark运行过程中各个使用资源的地方,通过调节各种参数,来优化资源使用的效率,从而提升Spark作业的执行性能。以下参数就是Spark中主要的资源参数,每个参数都对 ...

Tue Nov 08 19:18:00 CST 2016 0 3639
Spark(六)Spark之开发以及资源

Spark主要分为开发资源、数据倾斜、shuffle几个部分。开发资源是所有Spark作业都需要注意和遵循的一些基本原则,是高性能Spark作业的基础;数据倾斜,主要讲解了一套完整的用来解决Spark作业数据倾斜的解决方案;shuffle,面向 ...

Sat Jul 14 23:21:00 CST 2018 1 1431
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM