踩坑事件：windows操作系統下的eclipse中編寫SparkSQL不能從本地讀取或者保存parquet文件

相關內容簡體繁體

踩坑事件：windows操作系統下的eclipse中編寫SparkSQL不能從本地讀取或者保存parquet文件

本文轉載自查看原文 2016-03-09 16:05 2907 Spark

這個大坑... ....

如題，在Windows的eclipse中編寫SparkSQL代碼時，編寫如下代碼時，一運行就拋出一堆空指針異常：

        // 首先還是創建SparkConf
        SparkConf conf = new SparkConf()
                .setMaster("local")
                .setAppName("HiveDataSource");
        // 創建JavaSparkContext
        JavaSparkContext sc = new JavaSparkContext(conf);
       SQLContext sqlContext=new SQLContext(sc);

      // DataFrame usersDF=sqlContext.read().parquet("hdfs://spark2:9000/francis/spark-core/users.parquet");
       DataFrame usersDF=sqlContext.read().parquet("users.parquet");

這個糾結啊... ...。

后來將數據保存到hdfs上可以運行。於是我誤以為不能再本地保存，后來google了一下，看很多demo都是將數據保存到本地的parquet中，於是這個猜測否決了。

后來在這里找到了答案：http://stackoverflow.com/questions/25505365/parquet-file-in-spark-sql

其回復如下：

1down vote

Spark is compatible with Windows. You can run your program in a spark-shell session in Windows or you can run it using spark-submit with necessary argument such as "-master" (again, in Windows or other OS). You cannot just run your Spark program as an ordinary Java program in Eclispe without properly setting up the Spark environment and so on. You problem has nothing to do with Windows.

后來又在linux 上的spark-shell上驗證了一下，可以本地保存的!!!!

所以啊，要想保存在本地，還是使用spark-submit吧，不要直接在eclipse中運行了。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Spark(十二)【SparkSql中數據讀取和保存】 springboot 頭像上傳文件流保存文件流返回瀏覽器查看區分操作系統 windows 7 or linux 從零開始,Windows操作系統下的超詳細的本地項目在阿里雲服務器的發布過程 PXE——無人值守自動安裝Linux操作系統（踩坑記錄）【自制操作系統03】讀取硬盤中的數據 Spark操作parquet文件解除windows隱藏受保護的操作系統文件重裝 windows操作系統【windows 操作系統】異步【windows 操作系統】並發