原文:大数据技术之_19_Spark学习_06_Spark 源码解析 + Spark 通信架构、脚本解析、standalone 模式启动、提交流程 + Spark Shuffle 过程 + Spark 内存管理与分配 + Spark 部署模式

第 章 Spark 整体概述 . 整体概念 . RDD 抽象 . 计算抽象 . 集群模式 . RPC 网络通信抽象 . 启动 Standalone 集群 . 核心组件 . 核心组件交互流程 . Block 管理 . 整体应用第 章 Spark 通信架构 . 通信组件概览 . Endpoint 启动过程 . Endpoint Send amp Ask 流程 . Endpoint Receive 流 ...

2019-05-02 20:12 0 797 推荐指数:

查看详情

Spark Standalone 提交模式

一.Client提交模式   提交命令:     ./spark-submit --master spark://node1:7077 --class org.apache.spark.examples.SparkPi ../lib ...

Mon Mar 11 06:46:00 CST 2019 0 577
大数据技术之_19_Spark学习_07_Spark 性能调优 + 数据倾斜调优 + 运行资源调优 + 程序开发调优 + Shuffle 调优 + GC 调优 + Spark 企业应用案例

第1章 Spark 性能优化1.1 调优基本原则1.1.1 基本概念和原则1.1.2 性能监控方式1.1.3 调优要点1.2 数据倾斜优化1.2.1 为何要处理数据倾斜(Data Skew)1.2.2 如何定位导致数据倾斜的代码1.2.3 如何缓解/消除数据倾斜1.3 运行资源调优1.3.1 ...

Sat May 04 19:57:00 CST 2019 0 605
Spark学习笔记(三)—— Standalone模式

上篇笔记记录了Local模式的一些内容,但是实际的应用中很少有使用Local模式的,只是为了我们方便学习和测试。真实的生产环境中,Standalone模式更加合适一点。 1、基础概述 Standalone不是单机模式,它是集群,但是是基于Spark独立调度器的集群,也就是说它是Spark特有 ...

Fri Jan 10 22:00:00 CST 2020 0 276
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM