花费 6 ms
Databricks 第4篇:pyspark.sql 分组统计和窗口

对数据分析时,通常需要对数据进行分组,并对每个分组进行聚合运算。在一定意义上,窗口也是一种分组统计的方法。 分组数据 DataFrame.groupBy()返回的是GroupedData类,可以对 ...

Mon Jan 11 16:38:00 CST 2021 0 1308
Azure Key Vault 简介

Azure Key Vault(密钥库)是用于安全地存储和访问Secret的云服务,Secret是需要严格控制访问权限的内容,例如API密钥,密码,证书或加密密钥。Key Vault Service支 ...

Mon Jan 18 22:31:00 CST 2021 0 979
Databricks 第6篇:Spark SQL 维护数据库和表

Spark SQL 表的命名方式是db_name.table_name,只有数据库名称和数据表名称。如果没有指定db_name而直接引用table_name,实际上是引用default 数据库下的表。 ...

Wed Jan 13 21:21:00 CST 2021 0 992
Databricks 第2篇:pyspark.sql 简介

pyspark中的DataFrame等价于Spark SQL中的一个关系表。在pyspark中,DataFrame由Column和Row构成。 pyspark.sql.SparkSession ...

Fri Jan 08 03:10:00 CST 2021 0 943

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM