1.列舉常見的一些范數及其應用場景,如L0,L1,L2,L∞,Frobenius范數 答:p39-p40 ;還有p230-p236有regularization的應用 2.簡單介紹一下貝葉斯概率與 ...
: LSTM結構推導,為什么比RNN好 答案:推導forget gate,input gate,cell state, hidden information等的變化 因為LSTM有進有出且當前的cell informaton是通過input gate控制之后疊加的,RNN是疊乘,因此LSTM可以防止梯度消失或者爆炸 :梯度消失爆炸為什么 答案:略 :為什么你用的autoencoder比LSTM好 ...
2017-07-24 17:22 0 10906 推薦指數:
1.列舉常見的一些范數及其應用場景,如L0,L1,L2,L∞,Frobenius范數 答:p39-p40 ;還有p230-p236有regularization的應用 2.簡單介紹一下貝葉斯概率與 ...
● 神經網絡為啥用交叉熵。 參考回答: 通過神經網絡解決多分類問題時,最常用的一種方式就是在最后一層設置n個輸出節點,無論在淺層神經網絡還是在CNN中都是如此,比如,在AlexNet中最后的輸 ...
的依賴關系和數學操作 2、你有哪些深度學習(rnn、cnn)調參的經驗? https://www.j ...
的分布拉回到標准化的分布,使得激活函數的輸入值落在激活函數對輸入比較敏感的區域,從而使梯度變大,加快學習收 ...
● 深度學習了解多少,有看過底層代碼嗎?caffe,tf? ● 除了GMM-HMM,你了解深度學習在語音識別中的應用嗎? 參考回答: 講了我用的過DNN-HMM,以及與GMM-HMM的聯系與區別;然后RNN+CTC,這里我只是了解,大概講了一下CTC損失的原理;然后提了一下 ...
北京朗途融通信息科技有限公司 1、用_________創建一個隱藏的共享文件夾 2、常用的三種解析計算機命的方法有______,______ ,______。 3、應用層最常用的協議是 ____ ...
一、Java基礎 1. String類為什么是final的。 ( 1、由於String類不能被繼承,所以就不會被修改,這就避免了因為繼承引起的安全隱患; 2、String類在程序中出現的 ...
一、Java基礎 1. String類為什么是final的。 2. HashMap的源碼,實現原理,底層結構。 3. 說說你知道的幾個Java集合類:list、s ...