SparkSql讀取HDFS

本文轉載自查看原文 2020-01-19 10:46 1827 SPARK

public class SparkSqlBathLog {
public static void main(String[] args) {
SparkConf conf = new SparkConf();
conf.setMaster("local[2]").setAppName("jsonfile");
// spark 上下文
SparkContext sc = new SparkContext(conf);
//創建sqlContext獲取sqlcontext
SQLContext sqlContext = new SQLContext(sc);
//加載txt文件從hdfs
//RDD<String> stringRDD = sc.textFile("hdfs://192.168.48.11:9000/aaa/ssooo.txt");

DataFrame df = sqlContext.read().json("hdfs://node1:9000/aaa/ssooo.txt ");
df.show(30);
//
// DataFrame dfa = sqlContext.read().load("hdfs://192.168.48.11:9000/aaa/ssooo.txt");
// dfa.show(30);
// sqlContext.sql("use hive");
// df.show(20);
DataFrame df1 = sqlContext.read().format("json").load("./test.txt");
df1.show(30);

// df1.coalesce(1).write().format("String").save("hive 路徑");

// DataFrame corrupt_record = df.drop("_corrupt_record");
// corrupt_record.show(20);
// DataFrame table = corrupt_record.select("table");
// table.na().drop("all").show(20);
// JavaRDD<Row> rowJavaRDD = table.toJavaRDD();
// df1.show(20);
// df.show();
sc.stop();
}
}

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 SparkSQL讀取Hive中的數據 HDFS文件讀取詳解 SparkSQL SparkSQL之讀取數據庫的並行度分析 SparkSql自定義數據源之讀取的實現 HDFS 04 - 你能說說 HDFS 的寫入和讀取過程嗎？ hbase 從hdfs上讀取數據到hbase中 Spark:讀取hdfs gz壓縮包 Java 讀取HDFS文件系統 Spark讀取HDFS小文件優化