SparkSQL之UDF使用

本文转载自查看原文 2019-04-06 15:19 1507 spark

package cn.piesat.test

import org.apache.spark.sql.SparkSession

import scala.collection.mutable.ArrayBuffer


object SparkSQLTest {

  def main(args: Array[String]): Unit = {
    val spark=SparkSession.builder().appName("sparkSql").master("local[4]")
      .config("spark.serializer","org.apache.spark.serializer.KryoSerializer").getOrCreate()
    val sc=spark.sparkContext
    val sqlContext=spark.sqlContext
    val workerRDD=sc.textFile("F://Workers.txt").mapPartitions(itor=>{
      val array=new ArrayBuffer[Worker]()
      while(itor.hasNext){
        val splited=itor.next().split(",")
        array.append(new Worker(splited(0),splited(2).toInt,splited(2)))
      }
      array.toIterator
    })
    import spark.implicits._
    //注册UDF
    spark.udf.register("strLen",(str:String,addr:String)=>str.length+addr.length)
    val workDS=workerRDD.toDS()
    workDS.createOrReplaceTempView("worker")
    val resultDF=spark.sql("select strLen(name,addr) from worker")
    val resultDS=resultDF.as("WO")
    resultDS.show()

    spark.stop()

  }

}

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 sparkSQL中udf的使用 SparkSQL使用之如何使用UDF SparkSQL UDF使用方法与原理详解 SparkSQL UDF使用方法与原理详解 sparksql系列(六) SparkSql中UDF、UDAF、UDTF SparkSql使用Hive中注册的UDF函数报类找不到问题解决 SparkSQL UDF两种注册方式：udf() 和 register() 【Spark篇】---SparkSql之UDF函数和UDAF函数 sparksql 自定义用户函数（UDF） Spark（十三）SparkSQL的自定义函数UDF与开窗函数