一、Scala语言基础 1、Scala语言简介 Scala是一种多范式的编程语言,其设计的初衷是要集成面向对象编程和函数式编程的各种特性。Scala运行于Java平台(Java虚拟机),并兼容现有的Java程序。 学习Scala编程语言,为后续学习Spark奠定基础 ...
参考: http: spark.apache.org docs latest programming guide.html 后面懒得翻译了,英文记的,以后复习时再翻。 摘要:每个Spark application包含一个driver program来运行main函数,在集群上进行各种并行操作。 RDD是Spark的核心。除了RDD,Spark的另一个抽象时并行操作中使用的两种shared vari ...
2015-06-11 18:02 0 6496 推荐指数:
一、Scala语言基础 1、Scala语言简介 Scala是一种多范式的编程语言,其设计的初衷是要集成面向对象编程和函数式编程的各种特性。Scala运行于Java平台(Java虚拟机),并兼容现有的Java程序。 学习Scala编程语言,为后续学习Spark奠定基础 ...
可变(mutable)集合与不可变(immutable)集合 为了更易于完成不可变集合到可变集合的转换,或者反向转换,Scala提供了一些语法糖。纵使不可变集和映射并不支持真正的+=方法,Scala还是为此提供了+=的语法解释。 然而如果people声明为var,而不是val ...
List列表的基本操作 head方法获得列表的第一个元素 tail方法获得列表除第一个元素之外的其它元素 isEmpty:判断列表是否为空,空的话返回真 last:获得列表最后一个元素 in ...
一,变量 1,基本数据类型 2,基本运算符 3,定义变量 4,复杂变量 (1)定义数组Array: 声明:val aList=new Array[数据类型ty ...
之前的两篇文章是搭建Spark环境,准备工作做好之后接下来写一个简单的demo,功能是统计本地某个文件中每个单词出现的次数。开发环境为Idea+Maven,开发语言为scala,首先我们要在Idea中下载scala的插件,具体如下: 一、Idea开发环境准备 1.下载 ...
1.RDD介绍: RDD,弹性分布式数据集,即分布式的元素集合。在spark中,对所有数据的操作不外乎是创建RDD、转化已有的RDD以及调用RDD操作进行求值。在这一切的背后,Spark会自动将RDD中的数据分发到集群中,并将操作并行化。 Spark中的RDD就是一个不可 ...
列表间映射:map、flatMap和foreach 1.xs map f 操作返回把函数f应用在xs的每个列表元素之后由此组成的新列表。如: 2.flatMap操作符与map类似,不 ...
列表 列表的初始化及对其首尾的访问: 数组 创建长度已知但内容未知的数组: 根据已知元素初始化数组: 访问和更新数组元素: 列表缓存 ListBuffer是可变对象(包含在scala.collection.mutable包中 ...