1.windows下載並安裝Anaconda集成環境
URL:https://www.continuum.io/downloads

2.在控制台中測試ipython是否啟動正常

3.安裝JDK
3.1環境變量配置:



3.2測試:


4.安裝Spark並配置環境變量
4.1 URL: http://spark.apache.org/downloads.html

4.2解壓到本地磁盤的對應目錄

4.3配置環境變量


5.Pyspark配置
5.1配置如下系統變量


5.2修改spark\conf下的spark-env文件
在文件末尾加入如下三行
export PYSPARK_PYTHON=/E:/ProgramCJ/Anaconda2
export PYSPARK_DRIVER_PYTHON=/E:/ProgramCJ/Anaconda2
export PYSPARK_SUBMIT_ARGS='--master local[*]'
6.測試Pyspark是否安裝成功
6.1命令行中輸入pyspark測試

6.2 顯示如下,並新建python root

6.3測試sc的spark變量是否可用

注意:1.下載Spark請選擇已經編譯好的版本,如果選擇源碼版本,請使用maven或sbt進行編譯即可,方法為進入Spark安裝目錄,使用> sbt package 進行編譯
2.拷貝 E:\spark\python\pyspark 到 D:\anaconda\Lib\site-packages 目錄下
