SparkSQL之UDF使用

本文轉載自查看原文 2019-04-06 15:19 1507 spark

package cn.piesat.test

import org.apache.spark.sql.SparkSession

import scala.collection.mutable.ArrayBuffer


object SparkSQLTest {

  def main(args: Array[String]): Unit = {
    val spark=SparkSession.builder().appName("sparkSql").master("local[4]")
      .config("spark.serializer","org.apache.spark.serializer.KryoSerializer").getOrCreate()
    val sc=spark.sparkContext
    val sqlContext=spark.sqlContext
    val workerRDD=sc.textFile("F://Workers.txt").mapPartitions(itor=>{
      val array=new ArrayBuffer[Worker]()
      while(itor.hasNext){
        val splited=itor.next().split(",")
        array.append(new Worker(splited(0),splited(2).toInt,splited(2)))
      }
      array.toIterator
    })
    import spark.implicits._
    //注冊UDF
    spark.udf.register("strLen",(str:String,addr:String)=>str.length+addr.length)
    val workDS=workerRDD.toDS()
    workDS.createOrReplaceTempView("worker")
    val resultDF=spark.sql("select strLen(name,addr) from worker")
    val resultDS=resultDF.as("WO")
    resultDS.show()

    spark.stop()

  }

}

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 sparkSQL中udf的使用 SparkSQL使用之如何使用UDF SparkSQL UDF使用方法與原理詳解 SparkSQL UDF使用方法與原理詳解 sparksql系列(六) SparkSql中UDF、UDAF、UDTF SparkSql使用Hive中注冊的UDF函數報類找不到問題解決 SparkSQL UDF兩種注冊方式：udf() 和 register() 【Spark篇】---SparkSql之UDF函數和UDAF函數 sparksql 自定義用戶函數（UDF） Spark（十三）SparkSQL的自定義函數UDF與開窗函數