smooth L1損失函數

本文轉載自查看原文 2019-08-25 14:50 1468 Fast R-CNN

當預測值與目標值相差很大時，L2 Loss的梯度為(x-t)，容易產生梯度爆炸，L1 Loss的梯度為常數，通過使用Smooth L1 Loss，在預測值與目標值相差較大時，由L2 Loss轉為L1 Loss可以防止梯度爆炸。

L2 loss的導數（梯度）中包含預測值與目標值的差值，當預測值和目標值相差很大，L2就會梯度爆炸。說明L2對異常點更敏感。L1 對噪聲更加魯棒。

當差值太大時, loss在|x|>1的部分采用了 l1 loss，避免梯度爆炸。原先L2梯度里的x−t被替換成了±1, 這樣就避免了梯度爆炸, 也就是它更加健壯。

總的來說：相比於L2損失函數，其對離群點、異常值（outlier）不敏感，可控制梯度的量級使訓練時不容易跑飛。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 深度學習之L1、L2、smooth L1三類損失函數回歸損失函數1：L1 loss, L2 loss以及Smooth L1 Loss的對比交叉熵、Focal loss、L1，L2，smooth L1損失函數、IOU Loss、GIOU、DIOU和CIOU L1、L2損失函數、Huber損失函數 L1和L2：損失函數和正則化損失函數———有關L1和L2正則項的理解 L1與L2損失函數和正則化的區別 L1和L2 詳解(范數、損失函數、正則化) L1和L2 詳解(范數、損失函數、正則化) 從L1 loss到EIoU loss，目標檢測邊框回歸的損失函數一覽