SVM -支持向量機原理詳解與實踐之四

本文轉載自查看原文 2017-03-14 22:52 2440

SVM -支持向量機原理詳解與實踐之四

SVM原理分析
1. SMO算法分析

SMO即Sequential minmal optimization, 是最快的二次規划的優化算法，特使對線性SVM和稀疏數據性能更優。在正式介紹SMO算法之前，首先要了解坐標上升法。

坐標上升法(Coordinate ascent)

坐標上升法(Coordinate Ascent)簡單點說就是它每次通過更新函數中的一維，通過多次的迭代以達到優化函數的目的。

坐標上升法原理講解

為了更加通用的表示算法的求解過程，我們將算法表示成：

（3.13-1）

坐標上升法的算法為：

這個算法中最為關鍵的地方就是內循環對於的求解，意思是固定除了之外的所有a（從i=1~m）,也就是說將除外的其他變量看成是常數，並且將W看做是關於的函數，那么直接對求導優化得到極大值，在上面算法的版本中，內循環優化變量的順序是但是一個更高級的版本可能選擇其它的順序，例如我可以根據我們的期望來選擇下一個變量來更新，並讓W(a)有最大的增加。

當函數W在內循環中能夠最快的達到最優，則坐標上升是一個有效的算法，下面是一個坐標上升的示意圖：

上圖中的橢圓形線代表我們需要優化問題的二次函數的等高線，變量數為2，起始坐標是(2,2)，途中的直線是迭代優化的路徑，可以看到每一步都會相最優值前進一步，而且前進的路線都是平行與相應的坐標軸的，因為每次只優化一個變量。

C++算法編程實踐

問題：求解函數的最大值。

解：回顧我們前面分析的求取函數最大值的關鍵是，求解每一個迭代變量的導數，當求解某一變量的導數的時候，其他的變量看做是常數：

VS2013控制台工程參考代碼如下：

// Coordinate ascent.cpp : Defines the entry point for the console application.

#include "stdafx.h"

#include <iostream>

using namespace std;

#define f(x1,x2,x3) (-x1*x1-2*x2*x2-3*x3*x3+2*x1*x2+2*x1*x3-4*x2*x3+6)

int _tmain(int argc, _TCHAR* argv[])

{

double x1 = 1;

double x2 = 1;

double x3 = 1;

double f0 = f(x1, x2, x3);

double err = 1.0e-10;

while (true)

{

x1 = x2 + x3; //對x1求導的表達式，每次迭代后更新

x2 = 0.5*x1 - x3; //對x2求導的表達式，每次迭代后更新

x3 = 1.0 / 3 * x1 - 2.0 / 3 * x2; //對x3求導的表達式，每次迭代后更新

double ft = f(x1, x2, x3); //求函數值

if (abs(ft - f0)<err) //判斷f是否收斂

{

break; //收斂即完成求解過程

}

f0 = ft; //更新f0

}

cout << "\nmax{f(x1,x2,x3)}=" << f(x1, x2, x3) << endl;

cout << "取得最大值時的坐標：\n(x1,x2,x3)=(" << x1 << "," << x2 << "," << x3 << ")" << endl;

system("pause");

return 0;

}

運行結果如下：

SMO算法詳解

回到我們軟間隔與正則化章節（還有最優間隔分類器），我們的對偶問題，就是通過固定拉格朗日乘子a，得到w和b的最優化表達式（關於a的表達式），所以最后我們只需要確認a，我們就可以最終確定w和b，但是在討論SMO算法之前，我們並沒有真正求解出。這一章我們就會通過介紹SMO算法對對偶問題最后需要解決的問題：