Windows環境部署並調試pyspark(一)


 

准備:

windows環境說明:Python2.7 + pip
spark版本:spark-1.6.1-bin-hadoop2.6

step1:
下載並解壓tar包到自定義的路徑。(下載鏈接 https://d3kbcqa49mib13.cloudfront.net/spark-1.6.1-bin-hadoop2.6.tgz)

step2:
配置 %SPARK_HOME% 環境變量

 


step3:
拷貝pyspark對應的python工具包到python的安裝路徑下 "%PYTHON%/site-packages/"


step4:
使用PyCharm打開 "%SPARK_HOME%/examples\src\main\python"

 

step5:
運行pi.py並查看輸出

  至此,pyspark入門篇的windows環境搭建就完成了。 

注意:

1.運行時若出現“numpy”,“py4j”等依賴包找不到,自行使用pip進行安裝即可($ pip install xxx);
2.當在進行部分模型的訓練與加載出錯時,需要到真實的unix環境進行對應代碼的操作.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM