DataFrame 轉換為Dataset


寫在前面:
A DataFrame is a Dataset organized into named columns.
A Dataset is a distributed collection of data.

貼代碼:

package february.sql

import org.apache.spark.sql.SparkSession

/**
  * Description:
  * DataFrame 轉換為Dataset
  * DataSet的操作
  *
  * @Author: 留歌36
  * @Date: 2019/2/25 20:15
  */
object DatasetApp extends App {
  val spark = SparkSession.builder().appName(this.getClass.getSimpleName).master("local[2]").getOrCreate()
  // 注意: 需要導入隱私轉換
  import spark.implicits._

  val path = "f:\\infos.csv"
  // spark 解析csv文件,
  val DF = spark.read.option("header","true").option("inferSchema","true").csv(path)
  DF.show()

  // DataFrame 轉換為Dataset
  val DS = DF.as[Infos]
  // 常用的兩種輸出方式
  DS.select(DS("name")).show()
  DS.map(line => line.name).show()

  //

  spark.stop()

  case class Infos(id:Int, name:String,age:Int)
}

簡單的csv文件:
infos.csv

id,name,age
1,zhangshan,21
2,lisi,32
3,wangwu,15
4,haha,23

更多相關小demo:每天一個程序:https://blog.csdn.net/liuge36/column/info/34094


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM