我们下载Spark并在本地模式单机运行它。Spark由Scala编写,运行在Java虚拟机上。要在你的电脑上运行Spark,需要安装Java 6或以上的版本。
我们在Spark官网下载Spark的一个压缩的TAR文件。然后将它解压,配置好环境变量就可以使用了。(注意:不要将Spark安装到带空格的目录下哦- _ -)
首先,看一下,spark下面有什么东东:
README.md 包含用来入门Spark的简单的说明,当然都是英文啦!
bin 包含一些可以跟Spark进行交互的指令啊的一些东东,比如我们将稍后用到的Spark Shell
examples 包含一些可以查看和运行的Spark程序,对学习Spark的API很有用(比照着例子敲一敲,应该会有提升吧!这就是所谓的重复创造轮子吗?)
我们先在本地模式下,学习一下吧!