1.列举常见的一些范数及其应用场景,如L0,L1,L2,L∞,Frobenius范数 答:p39-p40 ;还有p230-p236有regularization的应用 2.简单介绍一下贝叶斯概率与 ...
: LSTM结构推导,为什么比RNN好 答案:推导forget gate,input gate,cell state, hidden information等的变化 因为LSTM有进有出且当前的cell informaton是通过input gate控制之后叠加的,RNN是叠乘,因此LSTM可以防止梯度消失或者爆炸 :梯度消失爆炸为什么 答案:略 :为什么你用的autoencoder比LSTM好 ...
2017-07-24 17:22 0 10906 推荐指数:
1.列举常见的一些范数及其应用场景,如L0,L1,L2,L∞,Frobenius范数 答:p39-p40 ;还有p230-p236有regularization的应用 2.简单介绍一下贝叶斯概率与 ...
● 神经网络为啥用交叉熵。 参考回答: 通过神经网络解决多分类问题时,最常用的一种方式就是在最后一层设置n个输出节点,无论在浅层神经网络还是在CNN中都是如此,比如,在AlexNet中最后的输 ...
的依赖关系和数学操作 2、你有哪些深度学习(rnn、cnn)调参的经验? https://www.j ...
的分布拉回到标准化的分布,使得激活函数的输入值落在激活函数对输入比较敏感的区域,从而使梯度变大,加快学习收 ...
● 深度学习了解多少,有看过底层代码吗?caffe,tf? ● 除了GMM-HMM,你了解深度学习在语音识别中的应用吗? 参考回答: 讲了我用的过DNN-HMM,以及与GMM-HMM的联系与区别;然后RNN+CTC,这里我只是了解,大概讲了一下CTC损失的原理;然后提了一下 ...
北京朗途融通信息科技有限公司 1、用_________创建一个隐藏的共享文件夹 2、常用的三种解析计算机命的方法有______,______ ,______。 3、应用层最常用的协议是 ____ ...
一、Java基础 1. String类为什么是final的。 ( 1、由于String类不能被继承,所以就不会被修改,这就避免了因为继承引起的安全隐患; 2、String类在程序中出现的 ...
一、Java基础 1. String类为什么是final的。 2. HashMap的源码,实现原理,底层结构。 3. 说说你知道的几个Java集合类:list、s ...