DNN可以用到計算機視覺上么?為什么需要CNN?
答案是必然的,但是DNN有不少缺點,為此引入CNN。
一般情況下,圖像數據比較大,意味着網絡的輸入層維度也比較大。當然可以對其進行處理,即使這樣,假設處理完后圖像變為2562563的彩色圖,即輸入的維度的值為196608。那么后面的隱藏層的神經元個數自然也能太少,假設為1024。僅僅一層的鏈接就有高達196608 * 1024的參數量。巨大的計算量給計算能力帶來不小的挑戰。
同時,模型的神經元數量大,可能會帶來過擬合。
引入的CNN保持了層級網絡結構,從輸入到輸出經過不同層次,不同層次有不同形式的運算或者功能。主要有以下層次:
- 數據輸入層/ Input layer - 數據預處理
- 卷積計算層/ CONV layer
- 激勵層/ Activation layer - 非線性變換
- 池化層/ Pooling layer - 下采樣
- 全連接層/ FC layer
- 批歸一化層/ Batch Normalization layer(可能有)