pyspark之创建SparkSession

本文转载自查看原文 2019-09-27 14:05 804 pyspark

1.from pyspark.sql import SparkSession

2.spark = SparkSession.builder.master("spark://master:7077") \
.appName('compute_customer_age') \
.config('spark.executor.memory','2g') \
.enableHiveSupport() \
.getOrCreate()

3.创建完毕

4.可以用于构建DataFrame|用于访问hive

4.1DataFrame

documentDF = spark.createDataFrame([
("Hi I heard about Spark".split(" "), ),
("I wish Java could use case classes".split(" "), ),
("Logistic regression models are neat".split(" "), )
], ["text"])

4.2访问hive

sql = """
"""
df = spark.sql(sql)
df.show()

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 pyspark SparkSession及dataframe基本操作 pyspark pyspark 通过 json 字符串创建DataFrame SparkSession 与SparkContext pyspark创建RDD数据、RDD转DataFrame以及保存 SparkSession - Spark SQL 的入口 spark教程(八)-SparkSession 【spark】SparkSession的API 【sparkSQL】SparkSession的认识 scala学习（3）-----wordcount【sparksession】