spark-sql性能优化之——多线程实现多Job并发执行

本文转载自查看原文 2019-03-14 15:53 2833 spark-sql

直接上代码

val spark = SparkSession.builder()
    .appName("name")
    .master("local[2]")
    .getOrCreate()

  val df = spark.read.json("src\\main\\resources\\json.txt")

  df.show()


  //没有多线程处理的情况，连续执行两个Action操作，生成两个Job
  df.rdd.saveAsTextFile("")
  df.rdd.saveAsTextFile("")


  //用Executor实现多线程方式处理Job
  val dfList = Array(df,df)
  val executorService = Executors.newFixedThreadPool(2)
  for(df <- dfList) {
    executorService.submit(new Callable[Boolean]() {
      def call() : Boolean  = {
        df.show()
        true
      }
    })
  }

  executorService.shutdown()

  spark.stop()

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 spark-sql性能测试 spark-sql jdbc连接参数优化 spark-sql执行流程分析导出spark-sql结果 1、spark-sql配置 Spark-SQL连接Hive Spark-SQL之DataFrame操作 Spark-Sql整合hive，在spark-sql命令和spark-shell命令下执行sql命令和整合调用hive Spark中的多线程并发处理 testng之多线程执行(并发执行)