機器學習基石--學習筆記02--Hard Dual SVM

本文轉載自查看原文 2015-01-03 21:33 2474 數據分析&挖掘/ 機器學習

背景

上一篇文章總結了linear hard SVM，解法很直觀，直接從SVM的定義出發，經過等價變換，轉成QP問題求解。這一講，從另一個角度描述hard SVM的解法，不那么直觀，但是可以避免feature轉換時的數據計算，這樣就可以利用一些很高緯度（甚至是無限維度）的feature轉換，得到一些更精細的解。

拉格朗日乘子式

首先，回顧一下SVM問題的定義，如下：

線性約束很煩，不方便優化，是否有一種方法可以將線性約束放到優化問題本身，這樣就可以無拘無束的優化，而不用考慮線性約束了。拉格朗日大神提供了一種方法，可以達到這個目的，稱之為拉格朗日乘子式（更通用的方法參考文章"簡易解說拉格朗日對偶"），形式如下，

這個公式是不是很奇怪，無端的多處了N個變量，但是再看下面的變化，就知道這個拉格朗日乘子式的厲害了。

什么，SVM問題等於右邊那個min max？沒錯，雖然初看感覺不科學，但是仔細分析，的確如此。首先，由於，令f(w,b) = ，

當f(w,b) > 0，在w，b固定的情況下，，max會將放大到；

當f(w,b)0，那么，那么。

所以，綜合兩種情況，SVM問題與min max變換公式等價。是不是很奇妙，不得不佩服拉格朗日大神。

對偶變換

上面的問題中min max的形式不方便求解，不過可以通過一番變化，導出max min的形式，這樣就可以從內到外，先計算里面的min，然后計算外面的max。這種變化叫對偶變化。

首先選任意一個固定的，並且，那么有

兩邊通過w,b取min，等式仍然成立，即

有多重選擇，但是上面的不等式一致成立，所以在眾多的選擇一個最大，上面的等式變形為，

這樣，min max就和max min建立了一定的聯系，但是由於是""，稱之為弱對偶（week duality）。""強對偶（strong duality）如何才能成立呢？需要滿足下面的條件，

原始問題是凸問題
原始問題線性可分
線性約束條件

太橋了，SVM問題完全符合上述約束，所以是對偶，這樣可以通過解右邊max min的問題來得到最終解！

問題化簡

經過上面的對偶變化，下面來一步一步的簡化我們的原始問題，

首先對b求偏導數,並且為0，有如下結果

帶入這個結果到上面的公司，化簡

接下啦，對w求偏導數，

所以，向量w為

將w帶入，並且去掉min，得到如下

執行到這里，現在目標函數只與有關，形式滿足QP，可以輕易得到，也就是得到w。但是在計算過程中，需要計算一個中間矩陣Q，維度為N*N，這個是主要計算開銷。上一講無需計算這個Q，因為Q的形式十分簡單。

問題來了，如何求解b，上面的目標函數中，在之前的簡化過程中消去了b，已經與b無關。

計算b

現在只剩下最后一個問題，如何計算b? 在之前的簡化過程中消去了b，上面的QP解與無關。

KKT條件幫助我們解決這個問題。如果原始問題和對偶問題都有最優解，且解相同，那么會滿足KKT條件。這也是一個充分必要條件，其中很重要的一點是complementary slackness(互補松弛性)，該條件有下面等式成立，

由於（對偶條件），且（原始條件），那么兩者有一個不為0時，另外一個必然為0。所以，只要找到一個，就可以利用這個性質計算出b，計算方法如下：

兩邊乘以,

理論來說，只需要一個點就可以，但是實際上由於計算有誤差，可能會計算所有的b，然后求平均。並且這些可以計算出b的點，就是支持向量，因為他們滿足了原始問題中支撐向量的定義。但是，並不是所有的支撐向量，都有對應的。一般的，我們只用的向量稱為支撐向量，而那些滿足支撐向量定義的向量稱之為候選支撐向量，有如下關系

並且，為了簡化計算，在計算w的時候，的計算均可以省去，如下

w的哲學

通過上面的計算，其實最后w是（）的線性組合。同樣的，PLA中w也是（）的線性組合。只是SVM利用支撐向量求解這個線性組合，PLA使用錯誤的向量。同理，邏輯回歸，線性回歸也有類似規律，稱這種現象為"w represented by data"。

總結

本節使用對偶問題，從另外一個側面求解了SVM，並且數據學推導相對復雜，計算量也增加了許多，因為需要求解一個N*N維度的矩陣Q。但是，為什么要做這些事情呢，hard linear SVM要簡單許多復？其實換成對偶問題是為了利用kernel做鋪墊，改kernel可以將維度轉化的計算省略，從而可以計算很復雜的轉化，這一點下一節討論。

PS:划線部分段落是由於包含公式，無法正常顯示，所以采用圖片方式在下方顯示。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習：SVM（目標函數推導：Hard Margin SVM、Soft Margin SVM）機器學習基石筆記9——機器可以怎樣學習（1）機器學習基石筆記14——機器可以怎樣學得更好（2）機器學習基石筆記15——機器可以怎樣學得更好（3）機器學習基石筆記16——機器可以怎樣學得更好（4）機器學習基石筆記13——機器可以怎樣學得更好（1）機器學習基石作業1 Python機器學習筆記：SVM（3）——證明SVM 機器學習基石筆記2——在何時可以使用機器學習(2) 機器學習基石筆記3——在何時可以使用機器學習(3)(修改版)