MSE Loss

本文转载自查看原文 2022-03-18 17:41 1445

我们发现，MSE能够判断出来模型2优于模型1，那为什么不采样这种损失函数呢？
主要原因是在分类问题中，使用sigmoid/softmx得到概率，配合MSE损失函数时，采用梯度下降法进行学习时，会出现模型一开始训练时，学习速率非常慢的情况
使用MSE的一个缺点就是其偏导值在输出概率值接近0或者接近1的时候非常小，这可能会造成模型刚开始训练时，偏导值几乎消失。