卷積層和BN層融合

本文轉載自查看原文 2018-08-27 17:08 4824 模型壓縮/ 卷積和 bn 融合/ Deep Learning

常規的神經網絡連接結構如下

屏幕快照 2018-08-27 下午4.43.56-w171

當網絡訓練完成, 在推導的時候為了加速運算, 通常將卷積層和 batch-norm 層融合, 原理如下

\[\begin{align*} y_{conv} &= w \cdot x + b \\ y_{bn} &= \gamma \cdot \left (\frac{y_{conv} - E[x]}{\sqrt{Var[x] + \epsilon}} \right)+\beta \\ &= \gamma \cdot \left (\frac{wx+b - E[x]}{\sqrt{ Var[x] + \epsilon}} \right)+\beta \\ \hat w &= \frac{\gamma}{\sqrt{Var[x] + \epsilon}}\cdot w \\ \hat b &= \frac{\gamma}{\sqrt{Var[x] + \epsilon}}\cdot \left({b - E[x]} \right)+\beta \\ y_{bn} &= \hat w \cdot x + \hat b \\ \end{align*} \]

推導時, E[x] 為 runnin_mean(滑動均值), Var[x] 為 running_var(滑動方差),
pytorch 的 running_var 存儲的是方差, 而不是標准差

caffe 中的 conv-bn-scale-relu 結構

屏幕快照 2018-08-27 下午5.22.42-w384

caffe模型的轉化可以參考pvanet的卷積層和 batch-norm融合代碼

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 對ONNX模型進行BN和卷積層的融合【卷積神經網絡】對BN層的解釋 BN層 tensorflow2.0——神經網絡的層（層全連接層、卷積層、池化層、BN層、激活層、dropout層及其他層） caffe中BN層【機器學習】卷積層，池化層，全連接層，BN層作用；CNN 網絡參數數量的計算卷積層和池化層卷積層與池化層卷積層、卷積核 Dropout和BN層的模式切換