spark入門系列教程三——spark sql(一）

本文轉載自查看原文 2018-12-06 18:42 2308

Spark SQL是用於結構化數據處理的Spark模塊，可以通過sql、dataset、dataframe與spark sql進行交互。更多理論性知識請移步官網http://spark.apache.org/docs/2.3.1/sql-programming-guide.html

在spark 2.0以前，多使用SqlContext進行開發，2.0以后，推薦使用SparkSession，本文將以SqlContext寫一個簡單的例子，在后面的博文中，會寫spark session相關的博文，並會詳細說明二者之間的差別。

接着上一篇的工程，繼續開發學習。

1.准備

1.1添加maven依賴

在pom文件中添加如下依賴：

1.2准備數據

新建一個txt文件，加入以下數據

如果有hdfs集群，可以將數據push到hdfs集群

新建scala object SparkSqlDemo1，加入如下代碼：

運行結果：

感謝閱讀！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 spark入門系列教程二——簡單入門實例 Spark入門系列教程一 —— Spark2.3.1 集群安裝 Spark入門系列視頻教程 Zeppelin的入門使用系列之使用Zeppelin來運行Spark SQL（四） Spark SQL 編程API入門系列之SparkSQL數據源 Spark入門教程收集 Spark SQL入門到實戰之（6）Spark Sql 連接mysql Spark入門——什么是Hadoop，為什么是Spark? Spark入門實戰系列--4.Spark運行架構 Spark入門實戰系列--6.SparkSQL（下）--Spark實戰應用