機器學習中 margin loss 、hinge loss 和 ramp loss 的區別

本文轉載自查看原文 2020-01-07 19:58 1402 學術paper

對分類問題，設 $y\in\{-1, 1\}$, $\mathop{sign}(f(x))$ 代表分類器，定義 $z = yf(x)$ 為 margin 值。
一般來說， margin loss function 代表只需輸入 margin 值即可輸出 loss 的 function. 也即 $\ell: \mathbb R \to \mathbb R$ or $\ell(y, f(x))\triangleq \ell(yf(x))$, 常見的 loss 都可寫成 margin loss 的這種形式，例如:

\[\begin{align*} \text{0-1 loss (PAC analysis)} \quad&1\{z\le 0\}\\ \text{logistic loss (Logistic Regression)} \quad&\log(1+\exp(-z))\\ \text{exponential loss (Boosting)} \quad&\exp(-z)\\ \text{hinge loss (SVM)} \quad&[1-z]_+\\ \text{square loss (Linear Regression)} \quad& (1-z)^2\\ \text{ramp loss (truncated at $s$)} \quad& [1-z]_+ - [s-z]_+ \end{align*} \]

以上參考:

ICML-19 On Symmetric losses for learning from corrupted labels
ICML-16 Loss Factorization, Weakly Supervised Learning and Label Noise Robustness
解析卷積神經網絡---深度學習實踐手冊 p108
機器學習理論研究導引課程講義（consistency）

但 ICML-19 Bridging Theory and Algorithm for Domain Adaptation中特指 margin loss 為如下 loss, 取代 0-1 loss
定義假設 $f$ 在 $(x,y)$ 處 margin 為： $\rho_f(x,y) = \frac{1}{2}(f(x,y)-\max_{y'\neq y}f(x,y'))$
再定義一個 $\rho$-間隔損失函數（機器學習理論研究導引講義中基於 Rademacher 復雜度的 Boosting 間隔分析理論也提到此）如下：

\[ \Phi_\rho(x) \triangleq \begin{cases} 0 \quad&\rho\le x\\ 1-x/\rho \quad &0\le x\le\rho\\ 1 \quad &x\le 0 \end{cases} \]

則 $\Phi_\rho(\rho_f(x,y))$ 為 $f$ 在樣例 $(x,y)$ 處的 margin loss

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習中的損失函數（着重比較：hinge loss vs softmax loss）機器學習-Loss函數-Triplet loss&Circle loss 損失函數：Hinge Loss（max margin）損失函數 hinge loss vs softmax loss SVM的損失函數（Hinge Loss) 機器學習總結：幾種常見的損失函數（Loss function）機器學習入門03 - 降低損失 (Reducing Loss) 基於Caffe的Large Margin Softmax Loss的實現（中）人臉識別和檢測中loss學習 - 10 - ArcFace: Additive Angular Margin Loss for Deep Face Recognition - 1 - 論文學習人臉識別和檢測中loss學習 - 6 - center loss