SVM實現多分類的三種方案

本文轉載自查看原文 2016-03-11 15:36 83816 b:Machine Learning

SVM本身是一個二值分類器

　　SVM算法最初是為二值分類問題設計的，當處理多類問題時，就需要構造合適的多類分類器。

　　目前，構造SVM多類分類器的方法主要有兩類

　　（1）直接法，直接在目標函數上進行修改，將多個分類面的參數求解合並到一個最優化問題中，通過求解該最優化問題“一次性”實現多類分類。這種方法看似簡單，但其計算復雜度比較高，實現起來比較困難，只適合用於小型問題中；

　　（2）間接法，主要是通過組合多個二分類器來實現多分類器的構造，常見的方法有one-against-one和one-against-all兩種。

一對多法（one-versus-rest,簡稱OVR SVMs）

　　訓練時依次把某個類別的樣本歸為一類,其他剩余的樣本歸為另一類，這樣k個類別的樣本就構造出了k個SVM。分類時將未知樣本分類為具有最大分類函數值的那類。

　　假如我有四類要划分（也就是4個Label），他們是A、B、C、D。

　　於是我在抽取訓練集的時候，分別抽取

　　（1）A所對應的向量作為正集，B，C，D所對應的向量作為負集；

　　（2）B所對應的向量作為正集，A，C，D所對應的向量作為負集；

　　（3）C所對應的向量作為正集，A，B，D所對應的向量作為負集；

　　（4）D所對應的向量作為正集，A，B，C所對應的向量作為負集；

　　使用這四個訓練集分別進行訓練，然后的得到四個訓練結果文件。

　　在測試的時候，把對應的測試向量分別利用這四個訓練結果文件進行測試。

　　最后每個測試都有一個結果f1(x),f2(x),f3(x),f4(x)。

　　於是最終的結果便是這四個值中最大的一個作為分類結果。

評價：

　　這種方法有種缺陷,因為訓練集是1:M,這種情況下存在biased.因而不是很實用。可以在抽取數據集的時候，從完整的負集中再抽取三分之一作為訓練負集。

一對一法（one-versus-one,簡稱OVO SVMs或者pairwise）

　　其做法是在任意兩類樣本之間設計一個SVM，因此k個類別的樣本就需要設計k(k-1)/2個SVM。

　　當對一個未知樣本進行分類時，最后得票最多的類別即為該未知樣本的類別。

　　Libsvm中的多類分類就是根據這個方法實現的。

　　假設有四類A,B,C,D四類。在訓練的時候我選擇A,B; A,C; A,D; B,C; B,D;C,D所對應的向量作為訓練集，然后得到六個訓練結果，在測試的時候，把對應的向量分別對六個結果進行測試，然后采取投票形式，最后得到一組結果。

　　投票是這樣的：
　　A=B=C=D=0;
　　(A,B)-classifier 如果是A win,則A=A+1;otherwise,B=B+1;
　　(A,C)-classifier 如果是A win,則A=A+1;otherwise, C=C+1;
　　...
　　(C,D)-classifier 如果是A win,則C=C+1;otherwise,D=D+1;
　　The decision is the Max(A,B,C,D)

評價：這種方法雖然好,但是當類別很多的時候,model的個數是n*(n-1)/2,代價還是相當大的。

層次支持向量機

層次分類法首先將所有類別分成兩個子類，再將子類進一步划分成兩個次級子類，如此循環，直到得到一個單獨的類別為止。對層次支持向量機的詳細說明可以參考論文《支持向量機在多類分類問題中的推廣》（劉志剛，計算機工程與應用，2004）

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 SVM多分類 SVM多分類 SVM處理多分類問題 8.SVM用於多分類比較KNN、邏輯回歸、SVM三種算法的分類效果 opencv SVM多分類人臉識別機器學習之SVM多分類 Multiclass SVM loss：多分類SVM損失函數 pytorch 實現多分類 tensorflow實現svm多分類 iris 3分類——本質上在使用梯度下降法求解線性回歸（loss是定制的而已）