網絡結構解讀之inception系列四：Inception V3

本文轉載自查看原文 2019-03-01 16:45 3320 卷積神經網絡inception-v1到inception-v3

網絡結構解讀之inception系列四：Inception V3

　　Inception V3根據前面兩篇結構的經驗和新設計的結構的實驗，總結了一套可借鑒的網絡結構設計的原則。理解這些原則的背后隱藏的動機比單純知道這個操作更有意義。

　　Rethinking the Inception Architecture for Computer Vision

主題：如何高效的增大網絡規模

　　通過分解卷積和正則實現高效計算

設計網絡原則

　　1.避免表征瓶頸。大部分時候，特征大小應當緩慢變小，在變小的同時增加維度。（下采樣是減小信息，而升維是增加信息）

　　2.高維特征更容易局部處理，收斂更快。（高維易分）

　　3.空間聚合能通過低維嵌入達到無損。（concat前可以降維，性能損失接近無）

　　4.平衡寬度和深度。（寬度和深度的比例要合適）

　　以上原則或許是有意義的，但不能直接參照，是在不明確的時候下使用的。（相對來說可靠，但不是絕對的原則）

分解卷積

　　2個3*3代替1個5*5 減少28%的計算量。

一個問題，第一個3*3后接線性激活會不會比ReLU更好？（因為5*5是線性操作，而2個3*3去代替的話全程應當是線性操作）實驗結果，relu更優，作者猜測是因為網絡能夠學習這種空間變化的增強（實驗證明這是數據增強）

非對稱分解

　　3*3卷積分解2個2*2節省11%計算量，而分解成1*3和3*1節省33%

　　理論上，任何卷積都能分解成不對稱卷積，但實驗發現，在低層次效果不好，在12到20層加較好

輔助分類器

　　經過實驗觀察，輔助分類器在訓練初期無明顯作用，接近訓練結束時性能開始超越，作者認為起到正則化作用。

高效降分辨率（下采樣）

　　按照准則1，在使用pooling進行下采樣前，激活值要升維。

　　參照下圖，如果使用左邊的方式，違背准則1。如果使用右邊，計算量較大（V1是這種方式）

　　Inception Reduction Module

結構InceptionV2（V3去掉BN）

　　　5*5分解卷積　　　　　　　　非對稱卷積　

基於原則2高維易分

標簽平滑正則LSR （ label smoothing regularization ）

　　作者認為硬標簽下softmaxloss會過擬合，改為soft label。

　　 croos-entropy:

　　最終損失：

　　LSR：

　　最終損失：

低分辨率輸入實驗

Inception對比實驗

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 網絡結構解讀之inception系列四：Inception V3 網絡結構解讀之inception系列五：Inception V4 網絡結構解讀之inception系列五：Inception V4 網絡結構解讀之inception系列二：GoogLeNet（Inception V1）網絡結構解讀之inception系列二：GoogLeNet（Inception V1）網絡結構解讀之inception系列三：BN-Inception（Inception V2）網絡結構解讀之inception系列三：BN-Inception（Inception V2）從GoogLeNet至Inception v3 Inception系列之Inception_v1 【源碼解讀】YOLO v3 訓練 - 02 網絡結構