感知機與梯度下降法


1.什么是感知機

感知機是一種線性分類模型,屬於判別模型。感知機模型的假設空間是定義在特征空間中的所有線性分類模型或線性分類器,即函數集合

2.感知機學習策略

2.1 數據集的線性可分性

給定一個數據集,其中,,,,

如果存在某個超平面 ,   能夠將數據集的正實例點和負實例點完全正確地划分到超平面的兩側,即對所有的實例  ,有,對所有的實例,有,則稱數據集為線性可分數據集。

2.2 損失函數

損失函數的一個自然選擇是五分類點的總數。但是,這樣的損失函數不是參數的連續可到函數,不易優化。損失函數的另一個選擇是誤分類點到超平面的總距離,這是感知機所采用的。

損失函數定義為:.

                                    

3.感知機學習算法

3.1 感知機學習算法的原始形式

感知機學習算法是誤分類驅動的,具體采用隨機梯度下降法。首先,任意選取一個超平面,然后用梯度下降法不斷地極小化目標函數。極小化過程中不是一次使中所有誤分類點地梯度下降,而是一次隨機選取一個誤分類點使其梯度下降。

假設誤分類點集合是固定的,那么損失函數的梯度由

                                     

                                     

 

 給出。

隨機選取一個誤分類點,對進行更新:

 

 式中是步長,在統計學習中又稱為學習率。這樣通過迭代可以期待損失函數不斷減小,直到為0。

 3.2 感知機學習算法的對偶形式

對偶形式的基本想法是,將表示為實例和標記的線性組合的形式,通過求解其系數而求得不失一般性,在上面算法中可以假設初始值均為0。對誤分類點通過

逐步修改,設修改n次,則關於的增量分別是,這里。這樣,從學習過程不難看出,最后學習到的可以分別表示為:

這里,時,表示第個實例點由於誤分而進行更新的次數。實例點更新次數越多,意味着它距離分離超平面越近,也就越難正確分類。話句話說,這樣的實例對學習結果影響最大。

 

 ★

感知機模型變為:

參數更新(梯度下降):     

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM