spark sql的agg函数,作用：在整体DataFrame不分组聚合

本文转载自查看原文 2019-02-13 15:13 5888 Spark SQL

1、agg(expers:column*) 返回dataframe类型 ，同数学计算求值 df.agg(max("age"), avg("salary")) df.groupBy().agg(max("age"), avg("salary")) 2、 agg(exprs: Map[String, String])  返回dataframe类型 ，同数学计算求值 map类型的 df.agg(Map("age" -> "max", "salary" -> "avg")) df.groupBy().agg(Map("age" -> "max", "salary" -> "avg")) 3、 agg(aggExpr: (String, String), aggExprs: (String, String)*)  返回dataframe类型 ，同数学计算求值 df.agg(Map("age" -> "max", "salary" -> "avg")) df.groupBy().agg(Map("age" -> "max", "salary" -> "avg")) 例子1： scala> spark.version res2: String = 2.0.2   scala> case class Test(bf: Int, df: Int, duration: Int, tel_date: Int) defined class Test   scala> val df = Seq(Test(1,1,1,1), Test(1,1,2,2), Test(1,1,3,3), Test(2,2,3,3), Test(2,2,2,2), Test(2,2,1,1)).toDF df: org.apache.spark.sql.DataFrame = [bf: int, df: int ... 2 more fields]   scala> df.show +---+---+--------+--------+
| bf| df|duration|tel_date|
+---+---+--------+--------+
|  1|  1|       1|       1|
|  1|  1|       2|       2|
|  1|  1|       3|       3|
|  2|  2|       3|       3|
|  2|  2|       2|       2|
|  2|  2|       1|       1|
+---+---+--------+--------+     scala> df.groupBy("bf", "df").agg(("duration","sum"),("tel_date","min"),("tel_date","max")).show() +---+---+-------------+-------------+-------------+
| bf| df|sum(duration)|min(tel_date)|max(tel_date)|
+---+---+-------------+-------------+-------------+
|  2|  2|            6|            1|            3|
|  1|  1|            6|            1|            3|

+---+---+-------------+-------------+-------------+ 注意：此处df已经少了列duration和tel_date，只有groupby的key和agg中的字段 例子2： import pyspark.sql.functions as func agg(func.max("event_time").alias("max_event_tm"),func.min("event_time").alias("min_event_tm"))

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 pandas group分组与agg聚合 DataFrame分组和聚合 pandas之分组聚合(agg,apply) spark DataFrame聚合操作 spark中agg函数的使用 PostgreSql 聚合函数string_agg与array_agg pandas DataFrame中agg聚合后重命名列标题 postgres 字符聚合函数string_agg SQL分组聚合查询 PostgreSQL 分组、聚合函数