原文:大數據技術之_19_Spark學習_05_Spark GraphX 應用解析小結

Spark GraphX 概述 Spark GraphX是什么 Spark GraphX 是 Spark 的一個模塊,主要用於進行以圖為核心的計算還有分布式圖的計算。 GraphX 他的底層計算也是 RDD 計算,它和 RDD 共用一種存儲形態,在展示形態上可以以數據集來表示,也可以圖的形式來表示。 Spark GraphX 有哪些抽象 頂點。 頂點的表示用 RDD VertexId, VD 來 ...

2019-04-30 19:48 0 517 推薦指數:

查看詳情

大數據技術之_19_Spark學習_06_Spark 源碼解析 + Spark 通信架構、腳本解析、standalone 模式啟動、提交流程 + Spark Shuffle 過程 + Spark 內存管理與分配 + Spark 部署模式

第1章 Spark 整體概述1.1 整體概念1.2 RDD 抽象1.3 計算抽象1.4 集群模式1.5 RPC 網絡通信抽象1.6 啟動 Standalone 集群1.7 核心組件1.8 核心組件交互流程1.9 Block 管理1.10整體應用第2章 Spark 通信架構2.1 通信組件概覽 ...

Fri May 03 04:12:00 CST 2019 0 797
大數據技術之_19_Spark學習_07_Spark 性能調優 + 數據傾斜調優 + 運行資源調優 + 程序開發調優 + Shuffle 調優 + GC 調優 + Spark 企業應用案例

第1章 Spark 性能優化1.1 調優基本原則1.1.1 基本概念和原則1.1.2 性能監控方式1.1.3 調優要點1.2 數據傾斜優化1.2.1 為何要處理數據傾斜(Data Skew)1.2.2 如何定位導致數據傾斜的代碼1.2.3 如何緩解/消除數據傾斜1.3 運行資源調優1.3.1 ...

Sat May 04 19:57:00 CST 2019 0 605
大數據Spark內核解析

1. Spark 內核概述 Spark內核泛指Spark的核心運行機制,包括Spark核心組件的運行機制、Spark任務調度機制、Spark內存管理機制、Spark核心功能的運行原理等,熟練掌握Spark內核原理,能夠幫助我們更好地完成Spark代碼設計,並能夠幫助我們准確鎖定項目運行 ...

Mon Feb 25 19:57:00 CST 2019 0 578
2. Spark GraphX解析

器上的邊來說,要跨機器通信傳輸數據,內網通信流量大       2)點分割(Vertex-Cut):每 ...

Mon Dec 16 13:23:00 CST 2019 0 276
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM