目录 Spark简介 整体认识 基本概念 核心概念 Spark部署 部署环境 Hadoop安装 Spark安装 scala安装 简单示例:WordCount(Spark ...
目录 前言 RDD详谈 RDD存储结构 RDD的操作 Transformation Action RDD依赖方式 窄依赖 Narrow Dependency Shuffle依赖 宽依赖 Shffle Wide Dependency 集群部署 组件 部署方式 集群部署举例 从RDD看集群任务调度 Spark监控界面 踩坑小记 Driver程序崩溃 kafka编码错误 总结 前言 在Spark的使用 ...
2017-05-27 18:19 0 3565 推荐指数:
目录 Spark简介 整体认识 基本概念 核心概念 Spark部署 部署环境 Hadoop安装 Spark安装 scala安装 简单示例:WordCount(Spark ...
目录 前言 累加器 广播变量 更新广播变量(rebroadcast) 总结 参考文献 前言 Spark踩坑记——初试 Spark踩坑记——数据库(Hbase+Mysql) Spark踩坑记——Spark ...
收录待用,修改转载已取得腾讯云授权 前言 前面总结的几篇spark踩坑博文中,我总结了自己在使用spark过程当中踩过的一些坑和经验。我们知道Spark是多机器集群部署的,分为Driver/Master/Worker,Master负责资源调度,Worker是不同的运算节点,由Master ...
目录 优化elastic集群踩过的坑 原架构 新架构 想象很美好、过程很艰辛、结果很nice 优化elastic集群踩过的坑 原架构 新架构 想象很美好、过程很艰辛、结果很nice 经过上面的架构调整,es集群 ...
Scala: Python: 因为spark交叉验证的数据集必须是data frame,也是醉了! ...
目录 前言 Spark streaming接收Kafka数据 基于Receiver的方式 直接读取方式 Spark向kafka中写入数据 Spark streaming+Kafka应用 Spark ...
初次尝试用 Spark+scala 完成项目的重构,由于两者之前都没接触过,所以边学边用的过程大多艰难。首先面临的是如何快速上手,然后是代码调优、性能调优。本章主要记录自己在项目中遇到的问题以及解决方式,下篇会尝试调优方法。末尾会分享自己的学习资料,也供大多菜鸟第一次使用作为参考。由于自己项目 ...
目录 前言 Spark Streaming持久化设计模式 DStreams输出操作 使用foreachRDD的设计模式 Spark访问Hbase Hbase通用连接类 Hbase输出操作 填坑记录 ...