原文:大数据技术之_19_Spark学习_01_Spark 基础解析 + Spark 概述 + Spark 集群安装 + 执行 Spark 程序

第 章 Spark 概述 . 什么是 Spark . Spark 特点 . Spark 的用户和用途第 章 Spark 集群安装 . 集群角色 . 机器准备 . 下载 Spark 安装包 . 配置 Spark Standalone 模式 . 配置 Spark History Server . 配置 Spark HA . 配置 Spark Yarn 模式第 章 执行 Spark 程序 . 执行第一 ...

2019-04-21 15:58 0 555 推荐指数:

查看详情

大数据技术之_19_Spark学习_05_Spark GraphX 应用解析小结

========== Spark GraphX 概述 ==========1、Spark GraphX是什么?  (1)Spark GraphX 是 Spark 的一个模块,主要用于进行以图为核心的计算还有分布式图的计算。  (2)GraphX 他的底层计算也是 RDD 计算,它和 RDD ...

Wed May 01 03:48:00 CST 2019 0 517
大数据技术之_19_Spark学习_06_Spark 源码解析 + Spark 通信架构、脚本解析、standalone 模式启动、提交流程 + Spark Shuffle 过程 + Spark 内存管理与分配 + Spark 部署模式

第1章 Spark 整体概述1.1 整体概念1.2 RDD 抽象1.3 计算抽象1.4 集群模式1.5 RPC 网络通信抽象1.6 启动 Standalone 集群1.7 核心组件1.8 核心组件交互流程1.9 Block 管理1.10整体应用第2章 Spark 通信架构2.1 通信组件概览 ...

Fri May 03 04:12:00 CST 2019 0 797
大数据技术之_19_Spark学习_07_Spark 性能调优 + 数据倾斜调优 + 运行资源调优 + 程序开发调优 + Shuffle 调优 + GC 调优 + Spark 企业应用案例

第1章 Spark 性能优化1.1 调优基本原则1.1.1 基本概念和原则1.1.2 性能监控方式1.1.3 调优要点1.2 数据倾斜优化1.2.1 为何要处理数据倾斜(Data Skew)1.2.2 如何定位导致数据倾斜的代码1.2.3 如何缓解/消除数据倾斜1.3 运行资源调优1.3.1 ...

Sat May 04 19:57:00 CST 2019 0 605
大数据Spark内核解析

1. Spark 内核概述 Spark内核泛指Spark的核心运行机制,包括Spark核心组件的运行机制、Spark任务调度机制、Spark内存管理机制、Spark核心功能的运行原理等,熟练掌握Spark内核原理,能够帮助我们更好地完成Spark代码设计,并能够帮助我们准确锁定项目运行 ...

Mon Feb 25 19:57:00 CST 2019 0 578
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM