花費 6 ms
Databricks 第4篇:pyspark.sql 分組統計和窗口

對數據分析時,通常需要對數據進行分組,並對每個分組進行聚合運算。在一定意義上,窗口也是一種分組統計的方法。 分組數據 DataFrame.groupBy()返回的是GroupedData類,可以對 ...

Mon Jan 11 16:38:00 CST 2021 0 1308
Azure Key Vault 簡介

Azure Key Vault(密鑰庫)是用於安全地存儲和訪問Secret的雲服務,Secret是需要嚴格控制訪問權限的內容,例如API密鑰,密碼,證書或加密密鑰。Key Vault Service支 ...

Mon Jan 18 22:31:00 CST 2021 0 979
Databricks 第6篇:Spark SQL 維護數據庫和表

Spark SQL 表的命名方式是db_name.table_name,只有數據庫名稱和數據表名稱。如果沒有指定db_name而直接引用table_name,實際上是引用default 數據庫下的表。 ...

Wed Jan 13 21:21:00 CST 2021 0 992
Databricks 第2篇:pyspark.sql 簡介

pyspark中的DataFrame等價於Spark SQL中的一個關系表。在pyspark中,DataFrame由Column和Row構成。 pyspark.sql.SparkSession ...

Fri Jan 08 03:10:00 CST 2021 0 943

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM