我們下載Spark並在本地模式單機運行它。Spark由Scala編寫,運行在Java虛擬機上。要在你的電腦上運行Spark,需要安裝Java 6或以上的版本。
我們在Spark官網下載Spark的一個壓縮的TAR文件。然后將它解壓,配置好環境變量就可以使用了。(注意:不要將Spark安裝到帶空格的目錄下哦- _ -)
首先,看一下,spark下面有什么東東:
README.md 包含用來入門Spark的簡單的說明,當然都是英文啦!
bin 包含一些可以跟Spark進行交互的指令啊的一些東東,比如我們將稍后用到的Spark Shell
examples 包含一些可以查看和運行的Spark程序,對學習Spark的API很有用(比照着例子敲一敲,應該會有提升吧!這就是所謂的重復創造輪子嗎?)
我們先在本地模式下,學習一下吧!