sparkR操作HDFS上面的CSV文件

本文轉載自查看原文 2016-03-01 14:24 1848 大數據相關

./bin/sparkR --packages com.databricks:spark-csv_2.10:1.3.0 --master yarn

hdfs://master:9000/tmp/demo.cvs 替換你的hdfs路徑
>sc = sparkR.init(master = "yarn″, appName="SparkR")
>sqlContext = sparkRSQL.init(sc)
>demo = read.df(sqlContext,'hdfs://master:9000/tmp/demo.cvs',source ='com.databricks.spark.csv')
>head(demo)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 spark讀取hdfs上的文件和寫入數據到hdfs上面 spark讀取hdfs上的文件和寫入數據到hdfs上面 SPARKR，對RDD操作的介紹 HDFS文件的基本操作 hdfs基本文件操作 Hive_hdfs導入csv文件 java 操作 csv文件 Java操作csv文件 python操作csv文件 csv文件操作