Deep learning：五十(Deconvolution Network簡單理解)

本文轉載自查看原文 2013-11-26 21:05 33374 機器學習/ Deep Learning

　　深度網絡結構是由多個單層網絡疊加而成的，而常見的單層網絡按照編碼解碼情況可以分為下面3類：

既有encoder部分也有decoder部分：比如常見的RBM系列（由RBM可構成的DBM, DBN等），autoencoder系列(以及由其擴展的sparse autoencoder, denoise autoencoder, contractive autoencoder, saturating autoencoder等)。
只包含decoder部分：比如sparse coding, 和今天要講的deconvolution network.
只包含encoder部分，那就是普通的feed-forward network.

　　Deconvolution network的中文名字是反卷積網絡，那么什么是反卷積呢？其概念從字面就很容易理解，假設A=B*C 表示的是：B和C的卷積是A，也就是說已知B和C，求A這一過程叫做卷積。那么如果已知A和B求C或者已知A和C求B，則這個過程就叫做反卷積了，deconvolution.

　　Deconvolution network是和convolution network(簡稱CNN)對應的，在CNN中，是由input image卷積feature filter得到feature map, 而在devonvolution network中，是由feature map卷積feature filter得到input image. 所以從這點看，作者強調deconvolution network是top-down是有道理的（具體可參考Zeiler的Deconvolutional networks），看下圖便可知：

　　上圖表示的是DN(deconvolution network的簡稱)的第一層，其輸入圖像是3通道的RGB圖，學到的第一層特征有12個，說明每個輸入通道圖像都學習到了4個特征。而其中的特征圖Z是由對應通道圖像和特征分別卷積后再求和得到的。

　　本人感覺層次反卷積網絡和層次卷積稀疏編碼網絡（Hierarchical Convolution Sparse Coding）非常相似，只是在Sparse Coding中對圖像的分解采用的是矩陣相乘的方式，而在DN這里采用的是矩陣卷積的形式。和Sparse coding中train過程交叉優化基圖像和組合系數的類似，DN中每次train時也需要交叉優化feature filter和feature map.

　　DN的train過程：

　　學習DN中第l(小寫的L)層網絡的特征時，需優化下面的目標函數：