如下,是 spark 相關系列的一些文章匯總,持續更新中......
Spark RPC
spark 源碼分析之五--Spark RPC剖析之創建NettyRpcEnv
spark 源碼分析之六--Spark RPC剖析之Dispatcher和Inbox、Outbox剖析
spark 源碼分析之七--Spark RPC剖析之RpcEndPoint和RpcEndPointRef剖析
spark 源碼分析之八--Spark RPC剖析之TransportContext和TransportClientFactory剖析
spark 源碼分析之十--Spark RPC剖析之TransportResponseHandler、TransportRequestHandler和TransportChannelHandler剖析
spark 源碼分析之九--Spark RPC剖析之StreamManager和RpcHandler
spark 源碼分析之十一--Spark RPC剖析之TransportClient、TransportServer剖析
spark 源碼分析之十二--Spark RPC剖析之Spark RPC總結
Spark 存儲
spark 源碼分析之十三 -- SerializerManager剖析
spark 源碼分析之十四 -- broadcast 是如何實現的?
Spark Streaming
spark streaming 接收kafka消息之一 -- 兩種接收方式
spark streaming 接收kafka消息之二 -- 運行在driver端的receiver
spark streaming 接收kafka消息之三 -- kafka broker 如何處理 fetch 請求
spark streaming 接收kafka消息之四 -- 運行在 worker 上的 receiver
spark streaming 接收kafka消息之五 -- spark streaming 和 kafka 的對接總結
Spark 任務調度
spark 源碼分析之二 -- SparkContext 的初始化過程
spark 源碼分析之三 -- LiveListenerBus介紹
spark 源碼分析之四 -- TaskScheduler的創建和啟動過程
spark 源碼分析之十九 -- DAG的生成和Stage的划分
Spark任務計算
spark shuffle寫操作三部曲之BypassMergeSortShuffleWriter
spark shuffle寫操作三部曲之UnsafeShuffleWriter
spark shuffle寫操作三部曲之SortShuffleWriter
Spark SQL
spark sql 自定義之 thriftserver 高可用