原文:大数据技术之_19_Spark学习_05_Spark GraphX 应用解析小结

Spark GraphX 概述 Spark GraphX是什么 Spark GraphX 是 Spark 的一个模块,主要用于进行以图为核心的计算还有分布式图的计算。 GraphX 他的底层计算也是 RDD 计算,它和 RDD 共用一种存储形态,在展示形态上可以以数据集来表示,也可以图的形式来表示。 Spark GraphX 有哪些抽象 顶点。 顶点的表示用 RDD VertexId, VD 来 ...

2019-04-30 19:48 0 517 推荐指数:

查看详情

大数据技术之_19_Spark学习_06_Spark 源码解析 + Spark 通信架构、脚本解析、standalone 模式启动、提交流程 + Spark Shuffle 过程 + Spark 内存管理与分配 + Spark 部署模式

第1章 Spark 整体概述1.1 整体概念1.2 RDD 抽象1.3 计算抽象1.4 集群模式1.5 RPC 网络通信抽象1.6 启动 Standalone 集群1.7 核心组件1.8 核心组件交互流程1.9 Block 管理1.10整体应用第2章 Spark 通信架构2.1 通信组件概览 ...

Fri May 03 04:12:00 CST 2019 0 797
大数据技术之_19_Spark学习_07_Spark 性能调优 + 数据倾斜调优 + 运行资源调优 + 程序开发调优 + Shuffle 调优 + GC 调优 + Spark 企业应用案例

第1章 Spark 性能优化1.1 调优基本原则1.1.1 基本概念和原则1.1.2 性能监控方式1.1.3 调优要点1.2 数据倾斜优化1.2.1 为何要处理数据倾斜(Data Skew)1.2.2 如何定位导致数据倾斜的代码1.2.3 如何缓解/消除数据倾斜1.3 运行资源调优1.3.1 ...

Sat May 04 19:57:00 CST 2019 0 605
大数据Spark内核解析

1. Spark 内核概述 Spark内核泛指Spark的核心运行机制,包括Spark核心组件的运行机制、Spark任务调度机制、Spark内存管理机制、Spark核心功能的运行原理等,熟练掌握Spark内核原理,能够帮助我们更好地完成Spark代码设计,并能够帮助我们准确锁定项目运行 ...

Mon Feb 25 19:57:00 CST 2019 0 578
2. Spark GraphX解析

器上的边来说,要跨机器通信传输数据,内网通信流量大       2)点分割(Vertex-Cut):每 ...

Mon Dec 16 13:23:00 CST 2019 0 276
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM