深度學習中 batchnorm 層是咋回事？

本文轉載自查看原文 2019-02-20 14:49 1205 機器學習/ 計算機視覺

參考了這個博客，博主寫的非常好 https://blog.csdn.net/qq_25737169/article/details/79048516

前言：Batchnorm是深度網絡中經常用到的加速神經網絡訓練，加速收斂速度及穩定性的算法，可以說是目前深度網絡必不可少的一部分。
本文旨在用通俗易懂的語言，對深度學習的常用算法–batchnorm的原理及其代碼實現做一個詳細的解讀。本文主要包括以下幾個部分。

第一節：Batchnorm主要解決的問題

首先，此部分也即是講為什么深度網絡會需要

1.1 Internal Covariate Shift

1.2 covariate shift

第二節：Batchnorm 原理解讀

本部分主要結合原論文部分，排除一些復雜的數學公式，對

之前就說過，為了減小

之所以稱之為batchnorm是因為所norm的數據是一個batch的，

1.先求出此次批量數據

接下來詳細介紹一下這額外的兩個參數，之前也說過如果直接做歸一化不做其他處理，神經網絡是學不到任何東西的，但是加入這兩個參數后，事情就不一樣了，先考慮特殊情況下，如果

第四節：Batchnorm的優點

主要部分說完了，接下來對BatchNorm做一個總結：

沒有它之前，需要小心的調整學習率和權重初始化，但是有了BN可以放心的使用大學習率，但是使用了BN，就不用小心的調參了，較大的學習率極大的提高了學習速度，
Batchnorm本身上也是一種正則的方式，可以代替其他正則方式如dropout等
另外，個人認為，batchnorm降低了數據之間的絕對差異，有一個去相關的性質，更多的考慮相對差異性，因此在分類任務上具有更好的效果。

注：或許大家都知道了，韓國團隊在2017NTIRE圖像超分辨率中取得了top1的成績，主要原因竟是去掉了網絡中的batchnorm層，由此可見，BN並不是適用於所有任務的，在image-to-image這樣的任務中，尤其是超分辨率上，圖像的絕對差異顯得尤為重要，所以batchnorm的scale並不適合。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 深度學習中 droupout層是咋回事？？ caffe中的BatchNorm層深度學習之BatchNorm（批量標准化）（原）torch和caffe中的BatchNorm層【深度學習】卷積神經網絡中Dropout、BatchNorm的位置選擇 PPT編輯的時候很卡，放映的時候不卡，咋回事？深度學習中Embedding層有什么用？ PyTorch學習之歸一化層（BatchNorm、LayerNorm、InstanceNorm、GroupNorm）對於batchnorm層的理解 PPT選擇圖片不能剪切，按鈕是灰色的，沒有出現按鈕是咋回事