Spark：DataFrame數據透視函數pivot

本文轉載自查看原文 2019-01-04 17:25 624

使用數據透視函數pivot：

val list = List(
  (2017, 1, 100), 
  (2017, 1, 50), 
  (2017, 2, 100), 
  (2017, 3, 50), 
  (2018, 2, 200), 
  (2018, 2, 100))
import spark.implicits._
val ds = spark.createDataset(list)
val df = ds.toDF("year", "month", "num")
val res:org.apache.spark.sql.DataFrame = 
  df.groupBy("year")
    .pivot("month")
    .sum("num")

df.show
+----+-----+---+
|year|month|num|
+----+-----+---+
|2017|    1|100|
|2017|    1| 50|
|2017|    2|100|
|2017|    3| 50|
|2018|    2|200|
|2018|    2|100|
+----+-----+---+

res.show
+----+----+---+----+
|year|   1|  2|   3|
+----+----+---+----+
|2018|null|300|null|
|2017| 150|100|  50|
+----+----+---+----+

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python——數據透視（介紹pivot_table函數的使用方法）【Spark】DataFrame關於數據常用操作 spark dataFrame 新增一列函數withColumn pandas 透視表 pivot_table Pandas透視表（pivot_table）詳解使用透視表pivot_table spark dataframe 處理數據增刪改查 oracle 使用pivot 函數進行批量數據的動態行轉列 Spark注冊UDF函數，用於DataFrame DSL or SQL pandas 學習第6篇：DataFrame - 數據處理（長寬格式、透視表）