tensorflow 训练网络loss突然出现nan的情况

本文转载自查看原文 2019-05-10 15:59 1558 tensorflow 遇到的坑

1、问题描述：开始训练一切都是那么的平静，很正常！

　　突然loss变为nan，瞬间懵逼！

2、在网上看了一些解答，可能是梯度爆炸，可能是有关于0的计算。然后我觉得可能是关于0的吧，然后进行了验证。

3、验证方法：因为我使用的是softmax loss，我直接打印每一步的输出向量中的最大值即:

print(np.max(y.eval({x:data})))

发现最大值接近1甚至有的就是1.0，可想而知，其他维度都接近0了，那么我们来看公式：

　　交叉熵loss: y_ * log(y)
　　当0*log(0) 的时候，则会出现nan。

原因如此解决办法应该很多吧！

我使用的加正则化损失，参考：https://www.jianshu.com/p/6ffd815e2d11

也可以在损失中加一个很小的正值

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 使用tensorflow训练模型时可能出现nan的几种情况 keras写的代码训练过程中loss出现Nan keras训练cnn模型时loss为nan python出现nan的情况分析使用caffe训练时Loss变为nan的原因总结神经网络训练中的train loss, test loss问题如何解决loss NAN的问题 tensorflow(2):神经网络优化(loss,learning_rate) 通过TensorFlow训练神经网络模型训练优化：降低loss