spark-sql性能優化之——多線程實現多Job並發執行

本文轉載自查看原文 2019-03-14 15:53 2833 spark-sql

直接上代碼

val spark = SparkSession.builder()
    .appName("name")
    .master("local[2]")
    .getOrCreate()

  val df = spark.read.json("src\\main\\resources\\json.txt")

  df.show()


  //沒有多線程處理的情況，連續執行兩個Action操作，生成兩個Job
  df.rdd.saveAsTextFile("")
  df.rdd.saveAsTextFile("")


  //用Executor實現多線程方式處理Job
  val dfList = Array(df,df)
  val executorService = Executors.newFixedThreadPool(2)
  for(df <- dfList) {
    executorService.submit(new Callable[Boolean]() {
      def call() : Boolean  = {
        df.show()
        true
      }
    })
  }

  executorService.shutdown()

  spark.stop()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 spark-sql性能測試 spark-sql jdbc連接參數優化 spark-sql執行流程分析導出spark-sql結果 1、spark-sql配置 Spark-SQL連接Hive Spark-SQL之DataFrame操作 Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合調用hive Spark中的多線程並發處理 testng之多線程執行(並發執行)