Spark：DataFrame数据透视函数pivot

本文转载自查看原文 2019-01-04 17:25 624

使用数据透视函数pivot：

val list = List(
  (2017, 1, 100), 
  (2017, 1, 50), 
  (2017, 2, 100), 
  (2017, 3, 50), 
  (2018, 2, 200), 
  (2018, 2, 100))
import spark.implicits._
val ds = spark.createDataset(list)
val df = ds.toDF("year", "month", "num")
val res:org.apache.spark.sql.DataFrame = 
  df.groupBy("year")
    .pivot("month")
    .sum("num")

df.show
+----+-----+---+
|year|month|num|
+----+-----+---+
|2017|    1|100|
|2017|    1| 50|
|2017|    2|100|
|2017|    3| 50|
|2018|    2|200|
|2018|    2|100|
+----+-----+---+

res.show
+----+----+---+----+
|year|   1|  2|   3|
+----+----+---+----+
|2018|null|300|null|
|2017| 150|100|  50|
+----+----+---+----+

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 spark中的透视函数pivot Python——数据透视（介绍pivot_table函数的使用方法） Python——DataFrame中pivot()函数解析 PIVOT(透视转换)和UNPIVOT(逆透视转换) spark DataFrame 读写和保存数据 Spark:读取mysql数据作为DataFrame 【Spark】DataFrame关于数据常用操作 pandas.DataFrame.pivot odoo - 关于透视图pivot 通过sql做数据透视表，数据库表行列转换(pivot和Unpivot用法)（一）