SVM:從數學上分析為什么優化cost function會產生大距離(margin)分類器


向量內積

uTv = vTu為兩個二維向量的內積,它等於p*||u||(其中p為向量v在向量u上的投影長度,是有+/-之分的,||u||為向量u的長度也稱為范數),它是一個實數(是一個標量)。

如上圖所示,當u與v之間的夾角小於90度時,p為正的;當u與v之間的夾角大於90度時,p為負的。

SVM的目標優化函數(cost function)與約束條件

這兒將問題進行簡化,令θ0=0(截距為0),n=2來分析下

SVM的目標優化函數(cost function)可以寫成上圖中的1/2倍的θ的范數(長度)的平方(θ0=0)

如上張PPT可知θTx(i)等同於p(i)*||θ||=θ1x1(i)2x2(i)

SVM:最大間距即最大投影,投影最大,則由約束條件得||θ||最小

 

 

從上圖可以看出,當我們選擇左邊那個分類邊界的時候,因為θ向量是與分類邊界垂直的,P(i)為x(i)到θ向量的投影,所以可以看出P(i)是很小的,要滿足約束條件(p(i)*||θ||>=1),則||θ||會很大,則不是cost function的最小值,故SVM在最小化cost function的時候,不會選擇這個分類邊界。

當我們選擇右邊的這個分類邊界的時候,可以看到P(i)相對較大,則||θ||會較小,故SVM在最小化cost function的時候,會選擇這個分類邊界。可以看到margin為x(i)到θ的投影,投影最大,即最大間距(margin)的由來。

上面是一種簡化,θ0=0,當θ0≠0,同樣可以得出為什么是最大margin分類器的原因(當然都是在C很大的情況下)

總結

在C很大的情況下,要使SVM的cost function最小,即使θ的范數(長度)最小,包含兩個約束條件(在這兩個約束條件下,以C為系數的那個term才為0,見之前的blog)

在約束條件的限制下,要使θ的范數(長度)最小,即使x(i)到θ的投影最大投影即為margin,所以就會產生large margin分類器


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM