CNN训练完结果输出全是0？问题原因的探索和总结

本文转载自查看原文 2021-11-15 16:08 2225

在前几年的分割实验中偶尔会碰到模型训练完后输出全是0的情况，前几天又碰到了一次，于是想着干脆把这个频发问题开个随笔记录和总结一下。

先说结论，一般来说导致这个问题的原因可能有：

原先觉得深度学习就是胡乱设计一通模型然后疯狂训练就完事了，觉得非常水。但现在再看一些结构会发现其中独特的结构还是有着合理的思想的，因此设计网络本身还是要围绕着一些基本法来的，天马行空四处架设连接不一定是好事。网络结构整体的简洁有时候往往是有效性和泛化性的保证。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 神经网络+CNN模型训练总结： vector输出的全是最后一个插入的数据的问题 CNN训练中的技巧使用caffe训练时Loss变为nan的原因总结 tesseract系列（4） -- tesseract训练问题总结训练FCN时遇到的问题总结《自控力》总结_完结如何高效的通过BP算法来训练CNN 在FASHION-MNIST上训练CNN capsule network——CNN仅仅考虑了“有没有”的问题，没有考虑feature map的结构关系。这个结构关系包括位置，角度等。Capsule layer的输出也跟feature map的max-pooling输出不同，capsule layer的输出是一个向量，这个向量包含了位置，大小，角度等信息，这是feature map仅能输出一个值所不具备的；训练比较慢