第一章 統計學習方法概論 統計學習的主要特點是: (1)統計學習以計算機及網絡為平台,是建立在計 算機及網絡之上的; (2)統計學習以數據為研究對象,是數據驅動的學科; (3)統 ...
第 章 k近鄰法 k近鄰法 k nearest neighbor, k NN 是一種基本分類與回歸方法。 k近鄰法假設給定一個訓練數據集,其 中的實例類別己定。分類時,對新的實例,根據其k個最近鄰的訓練實例的類別 通過多數表決等方式進行預測。k近鄰 法實際上利用訓練數據集對特征向量空間進行划分,並作為其分類的 模型 。k 值的選擇 距離度量及分類決策規則是k近鄰法的三個基本要素。 . k近鄰算法 ...
2015-07-28 12:55 0 1872 推薦指數:
第一章 統計學習方法概論 統計學習的主要特點是: (1)統計學習以計算機及網絡為平台,是建立在計 算機及網絡之上的; (2)統計學習以數據為研究對象,是數據驅動的學科; (3)統 ...
第12章 統計學習方法總結 1 適用問題 分類問題是從實例的特征向量到類標記的預測問題; 標注問題 是從觀測序列到標記序列(或狀態序列)的預測問題。可以認為分類問題是標注 問題的特殊情況。 分類問題中可能的預測結果是二類或多類; 而標注問題 ...
k近鄰算法 算法(k近鄰法): 輸入:訓練數據集: 輸出:實例x所屬的類y (1)根據給定的距離度量,在訓練集中找到距離x最近的k個點,涵蓋這k個點的x的鄰域記為Nk(x) (2)在Nk(x)中根據分類決策規則(如多數表決)決定 ...
提升方法 簡述:提升方法(boosting)是一種常用的統計學習方法,應用廣泛且有效。在分類問題中,它通過改變訓練樣本的權重,學習多個分類器,並將這些分類器進行線性組合,提高分類的性能。 本章 (1)介紹boosting方法的思路和代表性的boosting算法AdaBoost (2)通過訓練 ...
第7章 支持向量機 支持向量機(support vector machines, SVM)是一種二類分類模型。它的基本模型是定義在特征空間上的間隔最大的線性分類器;支持向量機還包括核技巧,這使它成為實質上的非線性分類器。支持向量機的學習策略就是間隔最大化,可形式化為一個求解凸二次規划 ...
第11章 條件隨機場 條件隨機場(conditional random field, CRF)是給定一組輸入隨機變量條件下 另一組輸出隨機變量的條件概率分布模型,其特點是假設輸出隨機變量構成馬爾 可夫隨機場。條件隨機場可以用於不同的預測問題,本章 主要講述線性鏈(linear ...
支持向量機(supportvectormachines,SVM) 是一種二類分類模型.它的基本模型是定義在特征空間上的間隔最大的線性分類器,間隔最大使它有別於感知機; 支持向量機還包括核技巧,這使它成為實質上的非線性分類器.支持向量機的學習策略就是間隔最大化,可形式化為一個求解凸二次 ...
KNN算法 基本模型:給定一個訓練數據集,對新的輸入實例,在訓練數據集中找到與該實例最鄰近的k個實例。這k個實例的多數屬於某個類,就把輸入實例分為這個類。 KNN沒有顯式的學習過程。 KNN使用的模型實際上對應於特征空間的划分。特征空間中,對每個訓練實例點\(x_i\),距離該點比其它點更近 ...