pyspark 通過 json 字符串創建DataFrame

本文轉載自查看原文 2018-07-25 16:11 1975 python/ spark/ Python

1、開發環境

python版本：3.6

spark版本：2.3.1

pyspark：2.3.1

2、腳本

from pyspark import SparkConf,SparkContext
from pyspark.sql import SQLContext,HiveContext
from pyspark.sql.types import *

####1、從json文件讀取數據，並直接生成DataFrame#######
path = "20180724141719.json"
df = sqlContext.read.json(path)
df.printSchema()

####################################
data_dict = { 
    "region": "cn", 
    "env": "dev", 
    "product": "snap"
    }

schema = StructType([
    StructField("region", StringType(), True),
    StructField("env", StringType(), True),
    StructField("product", StringType(), True)])

dslist = []                ## 空列表
dslist.append(data_dict)   ## 使用 append() 添加元素  
###2、通過json字符串生成DataFrame#############
myrdd = sc.parallelize(dslist)
df = sqlContext.read.json(myrdd)
df.printSchema()
####3、通過自定義schema和json字符串列表，生成DataFrame#######
df = sqlContext.createDataFrame(dslist,schema)
df.printSchema()
########################################################

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Spark 讀取json字符串轉為DataFrame spark創建DataFrame時將字符串轉換為日期 dataframe截取字符串 pyspark dataframe 轉 json 逐行輸出 webservice傳json字符串 JSON字符串書寫 Json與字符串互相轉換 JSON字符串解析 Json字符串取值怎么處理json字符串

pyspark 通過 json 字符串 創建DataFrame

免責聲明！

pyspark 通過 json 字符串創建DataFrame