Margin Loss 損失函數的設計

本文轉載自查看原文 2018-03-16 16:23 7487 每天搞懂一點點

參考： http://blog.csdn.net/luo123n/article/details/48878759

Hinge Loss

也叫 max-margin objective 其最著名的應用是作為SVM的目標函數

其二分類情況下，公式如下：

y是預測值(-1與1之間，t是目標值+/-1)

其含義為，y的值在-1到1之間就可以了，並不鼓勵 $| y | > 1$

from PRML:

The Hinge Loss E(z) = max(0,1-z) is plotted in blue, the Log Loss in red, the Square Loss in green and the misclassification error in black.

換用其他的Loss函數的話，SVM就不再是SVM了。

知乎：正是因為HingeLoss的零區域對應的正是非支持向量的普通樣本，從而所有的普通樣本都不參與最終超平面的決定，這才是支持向量機最大的優勢所在，對訓練樣本數目的依賴大大減少，而且提高了訓練效率。

hinge loss是一個凸函數，很多常用的凸優化技術都可以使用。不過它是不可微的，只是有subgradient

參考： http://www.cnblogs.com/ooon/p/5539687.html

SVM求解使通過建立二次規划原始問題，引入拉格朗日乘子法，然后轉換成對偶的形式去求解，這是一種理論非常充實的解法。這里換一種角度來思考，在機器學習領域，一般的做法是經驗風險最小化 ERM ，即構建假設函數為輸入輸出間的映射，然后采用損失函數來衡量模型的優劣。求得使損失最小化的模型即為最優的假設函數，采用不同的損失函數也會得到不同的機器學習算法，比如這里的主題 SVM 采用的是 Hinge Loss ，Logistic Regression 采用的則是負 $\log$

紅色的線是log損失，E(x) = -log(P(Y|X))