嵌入式 ThriftServer in Spark

本文轉載自查看原文 2016-07-12 17:49 2752 Spark

我們知道在Spark中可以通過start-thriftServer.sh 來啟動ThriftServer，之后並可以通過beeline或者JDBC來連接並執行Spark SQL。在一般的Spark應用中，通常並不希望另外起一個服務進程，自然就要問：可以在Spark dirver program里啟一個嵌入式的ThriftServer嗎？

答案是Yes。要啟動ThriftServer，首先需要HiveContext，並且需要在Spark中已經configure好了Hive。通過啟動HiveContext，可以利用 DataFrame 的saveAsTable方法將dataframe save 成 Hive table，達到持久化效果。下面是代碼示例：

import org.apache.spark.sql.hive.HiveContext
import  org.apache.spark.sql.hive.thriftserver._
 
// start the Thrift Server with existing sqlContext casting to HiveContext
HiveThriftServer2.startWithContext(sqlContext.asInstanceOf[HiveContext])
 
// wisdom_lu_country has two columns: id and desc 
case class lu_country(id:Short,desc:String)
 
// load the file as RDD, split each line to id and desc, and convert it to DataFrame
val countryDF = sc.textFile("/FB_100/wisdom_lu_country.csv").map(_.split('^')).map(p=>lu_country(p(0).toShort,p(1))).toDF()

// save as Hive table
countryDF.write.saveAsTable("wisdom_lu_country")

上述代碼在spark-shell中執行成功。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 嵌入式開發嵌入式基本硬件知識嵌入式Linux之telnet python與嵌入式的火花 Spark ThriftServer使用的大坑嵌入式入門學習筆記4：[轉]什么是嵌入式底層驅動開發和嵌入式底層軟件開發嵌入式面試題嵌入式 qt 學習筆記嵌入式系統學習步驟：嵌入式驅動學習路線