spark中RDD轉化成DataSet類型的方式進行訪問

本文轉載自查看原文 2019-10-08 22:55 483

1）創建一個樣例類

scala> case class People(name:String,age:Long)
defined class People

2）創建DataSet

scala> val caseClassDS = Seq(People("Andy",32)).toDS()
caseClassDS: org.apache.spark.sql.Dataset[People] = [name: string, age: bigint]

這樣people不僅僅有類型，而且還有了結構，這樣用起來會更加方便一些。

3）caseClassDS.你會發現這里有很多種方法，也可以show，也可以limit等等。

scala> caseClassDS.
agg describe intersect reduce toDF
alias distinct isLocal registerTempTable toJSON
apply drop isStreaming repartition toJavaRDD
as dropDuplicates javaRDD rollup toLocalIterator
cache dtypes join sample toString
checkpoint except joinWith schema transform
coalesce explain limit select union
col explode map selectExpr unionAll
collect filter mapPartitions show unpersist
collectAsList first na sort where
columns flatMap orderBy sortWithinPartitions withColumn
count foreach persist sparkSession withColumnRenamed
createGlobalTempView foreachPartition printSchema sqlContext withWatermark
createOrReplaceTempView groupBy queryExecution stat write
createTempView groupByKey randomSplit storageLevel writeStream
crossJoin head randomSplitAsList take
cube inputFiles rdd takeAsList

這里和dataframe差不多的。

4）這里我們用createGlobalTempView試一試

scala> caseClassDS.createGlobalTempView("People")

5)好了，我們這是時候想想，可以用spark.sql查詢，select語句直接查詢想查詢的內容即可。

scala> spark.sql("select * from global_temp.People").show()
+----+---+
|name|age|
+----+---+
|Andy| 32|
+----+---+

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 go語言int類型轉化成string類型的方式 python3.6.3中html頁面轉化成pdf java中如何將string轉化成long Python將list中的string批量轉化成int/float java中如何將string 轉化成Long以及BigDecimal js中字節B轉化成KB，MB，GB XML中的非法字符轉化成實體 excel中漢字批量轉化成拼音技巧（轉） js中字節B轉化成KB，MB，GB 將activity轉化成view