支持向量機原理(五)線性支持回歸

本文轉載自查看原文 2017-04-07 17:29 5343

　　　　在前四篇里面我們講到了SVM的線性分類和非線性分類，以及在分類時用到的算法。這些都關注與SVM的分類問題。實際上SVM也可以用於回歸模型，本篇就對如何將SVM用於回歸模型做一個總結。重點關注SVM分類和SVM回歸的相同點與不同點。

1. SVM回歸模型的損失函數度量

　　　　回顧下我們前面SVM分類模型中，我們的目標函數是讓

　　　　但是我們現在是回歸模型，優化目標函數可以繼續和SVM分類模型保持一致為

　　　　SVM需要我們定義一個常量

　　　　如下圖所示，在藍色條帶里面的點都是沒有損失的，但是外面的點的是有損失的，損失大小為紅色線的長度。

　　　　總結下，我們的SVM回歸模型的損失函數度量為：

e r r (x i, y i) = {0 | y i - w ∙ ϕ (x i) + b | - ϵ

2. SVM回歸模型的目標函數的原始形式

　　　　上一節我們已經得到了我們的損失函數的度量，現在可以可以定義我們的目標函數如下：

m i n

　　　　和SVM分類模型相似，回歸模型也可以對每個樣本

m i n

s . t .

ξ \lor i \geq 0,

　　　　依然和SVM分類模型相似，我們可以用拉格朗日函數將目標優化函數變成無約束的形式，也就是拉格朗日函數的原始形式如下：

L (w, b, α \lor, α \land, ξ \lor i, ξ \land i, μ \lor, μ \land) =

　　　　其中

3. SVM回歸模型的目標函數的對偶形式

　　　　上一節我們講到了SVM回歸模型的目標函數的原始形式,我們的目標是

m i n  w, b, ξ \lor i, ξ \land i

　　　　和SVM分類模型一樣，這個優化目標也滿足KKT條件，也就是說，我們可以通過拉格朗日對偶將我們的優化問題轉化為等價的對偶問題來求解如下：

m a x  μ \lor \geq 0, μ \land \geq 0, α \lor i \geq 0, α \land i \geq 0

　　　　我們可以先求優化函數對於

　　　　首先我們來求優化函數對於

\partial L \partial w = 0

\partial L \partial b = 0

\partial L \partial ξ \lor i = 0

\partial L \partial ξ \land i = 0

$w, b, ξ$

m a x  α \lor, α \land

s . t .

0 < α \lor i < C

0 < α \land i < C

　　　　對目標函數取負號，求最小值可以得到和SVM分類模型類似的求極小值的目標函數如下：

m i n  α \lor, α \land

s . t .

0 < α \lor i < C

0 < α \land i < C

　　　　對於這個目標函數，我們依然可以用第四篇講到的SMO算法來求出對應的

4. SVM回歸模型系數的稀疏性

　　　　在SVM分類模型中，我們的KKT條件的對偶互補條件為：

α \lor i (ϵ + ξ \lor i + y i - w ∙ ϕ (x i) - b) = 0

α \land i (ϵ + ξ \land i - y i + w ∙ ϕ (x i) + b) = 0

　　　　根據松弛變量定義條件，如果

　　　　我們定義樣本系數系數

β i = α \land i - α \lor i

　　　　根據上面

5. SVM 算法小結

　　　　這個系列終於寫完了，這里按慣例SVM 算法做一個總結。SVM算法是一個很優秀的算法，在集成學習和神經網絡之類的算法沒有表現出優越性能前，SVM基本占據了分類模型的統治地位。目前則是在大數據時代的大樣本背景下,SVM由於其在大樣本時超級大的計算量，熱度有所下降，但是仍然是一個常用的機器學習算法。

　　　　SVM算法的主要優點有：

　　　　1) 解決高維特征的分類問題和回歸問題很有效,在特征維度大於樣本數時依然有很好的效果。

　　　　2) 僅僅使用一部分支持向量來做超平面的決策，無需依賴全部數據。

　　　　3) 有大量的核函數可以使用，從而可以很靈活的來解決各種非線性的分類回歸問題。

　　　　4)樣本量不是海量數據的時候，分類准確率高，泛化能力強。

　　　　SVM算法的主要缺點有：

　　　　1) 如果特征維度遠遠大於樣本數，則SVM表現一般。

　　　　2) SVM在樣本量非常大，核函數映射維度非常高時，計算量過大，不太適合使用。

　　　　3）非線性問題的核函數的選擇沒有通用標准，難以選擇一個合適的核函數。

　　　　4）SVM對缺失數據敏感。

　　　　之后會對scikit-learn中SVM的分類算法庫和回歸算法庫做一個總結，重點講述調參要點，敬請期待。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 支持向量機原理(五)線性支持回歸支持向量機原理(一) 線性支持向量機支持向量機原理（一）線性支持向量機支持向量機原理支持向量機原理(二) 線性支持向量機的軟間隔最大化模型支持向量機原理(三)線性不可分支持向量機與核函數 SVM-支持向量機（三）SVM回歸與原理支持向量機 (三)：優化方法與支持向量回歸 SVM支持向量機原理支持向量回歸機（SVR）代碼