github博客传送门 csdn博客传送门 参考: https://my.oschina.net/u/876354/blog/1797489 LeNet C1层(卷积层):6@28×28 ...
github博客传送门 csdn博客传送门 参考: https://my.oschina.net/u/876354/blog/1797489 LeNet C1层(卷积层):6@28×28 ...
github博客传送门 csdn博客传送门 非过拟合情况 是否找到合适的损失函数?(不同问题适合不同的损失函数)(理解不同损失函数的适用场景) (解决思路)选择合适的损失函数(choosin ...
github博客传送门 csdn博客传送门 神经网络中激活函数的真正意义?一个激活函数需要具有哪些必要的属性?还有哪些属性是好的属性但不必要的? 1. 非线性: 即导数不是常数。这个条件是多层神 ...
github博客传送门 csdn博客传送门 如何确定是否出现梯度爆炸? 训练过程中出现梯度爆炸会伴随一些细微的信号,如: 模型无法从训练数据中获得更新(如低损失)。 模型不稳定,导致更 ...
github博客传送门 csdn博客传送门 什么是fine-tuning? 在实践中,由于数据集不够大,很少有人从头开始训练网络。常见的做法是使用预训练的网络(例如在ImageNet上训练的分类1 ...
github博客传送门 csdn博客传送门 什么样的数据集不适合用深度学习? 数据集太小,数据样本不足时,深度学习相对其它机器学习算法,没有明显优势。 数据集没有局部相关特性,目前深度学 ...