數據預處理系列
- 數據預處理 第1篇:探索數據
- 數據預處理 第2篇:數據預處理(缺失值)
- 數據預處理 第3篇:數據預處理(使用插補法處理缺失值)
- 數據預處理 第4篇:數據預處理(sklearn 插補缺失值)
- 數據預處理 第5篇:異常值分析
- 數據預處理 第6篇:數據預處理(標准化、歸一化、分類數據編碼和離散化)
評估模型的指標
- 評估回歸模型的指標:MSE、RMSE、MAE、R2、偏差和方差
- 評估分類模型的指標:召回率、精確率、F1值
- 評估分類模型的指標:ROC/AUC
回歸模型系列
- 回歸模型 第1篇:線性模型概述
分類模型系列
- 分類模型 第1篇:分類模型概述
聚類模型系列:
時間序列分析系列:
推薦模型系列:
R 數據挖掘系列(未完結):
- 數據挖掘 第一篇:聚類分析(划分)
- 數據挖掘 第二篇:基於距離評估數據的相似性和相異性
- 數據挖掘 第三篇:聚類的評估(簇數確定和輪廓系數)和可視化
- 數據挖掘 第四篇:OLS回歸分析
- 數據挖掘 第五篇:分類(kNN)
Azure Databricks 系列:
- Databricks 第1篇:初識Databricks,創建工作區、集群和Notebook
- Databricks 第2篇:pyspark.sql 簡介
- Databricks 第3篇:pyspark.sql 通過JDBC連接數據庫
- Databricks 第4篇:pyspark.sql 分組統計和窗口
- Databricks 第5篇:Databricks文件系統(DBFS)
- Databricks 第6篇:Spark SQL 維護數據庫和表
- Databricks 第7篇:管理Secret
- Databricks 第8篇:把Azure Data Lake Storage Gen2 (ADLS Gen 2)掛載到DBFS
- Databricks 第9篇:
SQL Server 審計系列:
參考文檔: