hive,把一個表中計算好的數據,存到另一個外部表中

本文轉載自查看原文 2018-12-26 17:06 934 Hive

直接上代碼:

第一部分:

case class OrdPacsresult_obj(pk_dcpv: String, result_obj: String)

第二部分:

def ordsubj: Unit = {
    import sparkSession.implicits._
    import sparkSession.sql
    val dataset: Dataset[OrdPacsresult_subj] = sql("select pk_dcpv,result_obj,result_subj from diagbot.ord_rec_pacs_filter where result_subj is not null").as[OrdPacsresult_subj]

    val mapRDD: Dataset[(String, String)] = dataset.map(x => {
      val pk_dcpv: String = x.pk_dcpv
      val result_subj = x.result_subj
      (pk_dcpv, result_subj)
    })
    val rdd: RDD[(String, String)] = mapRDD.rdd.repartition(100)
    val key: RDD[(String, String)] = rdd.reduceByKey((x, y) => {
      val buffer: StringBuffer = new StringBuffer()
      buffer.append(x).append("\n")
      if (!buffer.toString.contains(y)) {
        buffer.append(y).append("\n")
      }
      buffer.toString
    })
    val f: DataFrame = key.map(x => {
      OrdPacsresult_subj(x._1, x._2)
    }).toDF()
    f.repartition(1).write.parquet("hdfs://192.168.2.258:9000/datas/parquetFile/OrdPacsresult_subj")
  }

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 hive判斷數據一個表是否在另一個表中（二） SQL 從一個表讀取數據存到另一個表 sql把一個表的某幾列的數據存到另一個表里 MySQL查詢在一個表而不在另一個表中的數據 Oracle把一個表的數據復制到另一個表中 oracle把一個表的數據復制到另一個表中 mongo 復制一個表的數據到另一個表中 SQL語句將一個表的數據寫入到另一個表中 oracle 之復制一個表的數據到另一個表中記錄一個hive清空外部表數據的辦法