注:本文中涉及到的公式一律省略(公式不好敲出來),若想了解公式的具體實現,請參考原著。 1、基本概念 (1)聚類的思想: 將數據集划分為若干個不想交的子集(稱為一個簇cluste ...
一 矩陣求導 復雜矩陣問題求導方法:可以從小到大,從scalar到vector再到matrix。 x is a column vector, A is a matrix d A amp x x dx A d A x dx A d xT amp x A dxT A d xT A dxT A d xT amp x A dx AT d xT A dx AT d xT amp x A amp x x dx ...
2017-07-24 20:04 0 1372 推薦指數:
注:本文中涉及到的公式一律省略(公式不好敲出來),若想了解公式的具體實現,請參考原著。 1、基本概念 (1)聚類的思想: 將數據集划分為若干個不想交的子集(稱為一個簇cluste ...
半監督學習:綜合利用有類標的數據和沒有類標的數據,來生成合適的分類函數。它是一類可以自動地利用未標記的數據來提升學習性能的算法 1、生成式半監督學習 優點:方法簡單,容易實現。通常在有標記數據極少時,生成式半監督學習方法比其他方法性能更好 缺點:假設的生成式模型必須與真實 ...
數據預處理的常用流程: 1)去除唯一屬性 2)處理缺失值 3)屬性編碼 4)數據標准化、正則化 5)特征選擇 6)主成分分析 1、去除 ...
1、損失函數和風險函數 (1)損失函數:常見的有 0-1損失函數 絕對損失函數 平方損失函數 對數損失函數 (2)風險函數:損失函數的期望 經驗風險:模型在數據集T上的平均損失 ...
注:因為公式敲起來太麻煩,因此本文中的公式沒有呈現出來,想要知道具體的計算公式,請參考原書中內容 降維就是指采用某種映射方法,將原高維空間中的數據點映射到低維度的空間中 1、主成分分析(PCA) 將n維樣本X通過投影矩陣W,轉換為K維矩陣Z 輸入:樣本集D,低維空間d ...
###機器學習的基礎概念 機器學習時一門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。它是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。 機器學習主要使用的學習方法是歸納,而不是演繹。 機器學習 ...
概率論的一些基礎知識 條件概率 \(P(B|A) = \frac{1}{3}\) 表示的意思為當A發生的時候,B發生的概率 有公式 \[P(B|A) = \frac{P(AB)}{P(A)} \] \[P(AB) = P(B|A)*P(A)=P(A|B)*P(B ...