smooth L1损失函数

本文转载自查看原文 2019-08-25 14:50 1468 Fast R-CNN

当预测值与目标值相差很大时，L2 Loss的梯度为(x-t)，容易产生梯度爆炸，L1 Loss的梯度为常数，通过使用Smooth L1 Loss，在预测值与目标值相差较大时，由L2 Loss转为L1 Loss可以防止梯度爆炸。

L2 loss的导数（梯度）中包含预测值与目标值的差值，当预测值和目标值相差很大，L2就会梯度爆炸。说明L2对异常点更敏感。L1 对噪声更加鲁棒。

当差值太大时, loss在|x|>1的部分采用了 l1 loss，避免梯度爆炸。原先L2梯度里的x−t被替换成了±1, 这样就避免了梯度爆炸, 也就是它更加健壮。

总的来说：相比于L2损失函数，其对离群点、异常值（outlier）不敏感，可控制梯度的量级使训练时不容易跑飞。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 深度学习之L1、L2、smooth L1三类损失函数回归损失函数1：L1 loss, L2 loss以及Smooth L1 Loss的对比交叉熵、Focal loss、L1，L2，smooth L1损失函数、IOU Loss、GIOU、DIOU和CIOU L1、L2损失函数、Huber损失函数 L1和L2：损失函数和正则化损失函数———有关L1和L2正则项的理解 L1与L2损失函数和正则化的区别 L1和L2 详解(范数、损失函数、正则化) L1和L2 详解(范数、损失函数、正则化) 从L1 loss到EIoU loss，目标检测边框回归的损失函数一览