tf.nn.max_pool(value, ksize, strides, padding, data_format, name)
參數介紹:
value:需要池化的輸入,一般池化層接在卷積層后面,所以輸入通常是feature map,依然是[batch, height, width, channels]這樣的shape。
batch | 訓練時一個batch的圖片數量 |
in_height | 圖片高度 |
in_width | 圖片寬度 |
in_channels | 圖像通道數 |
ksize:池化窗口的大小,取一個四維向量,一般是[1, in_height, in_width, 1],因為我們不想在batch和channels上做池化,所以這兩個維度設為了1。
strides:和卷積類似,窗口在每一個維度上滑動的步長,一般也是[1, stride,stride, 1]。
padding:和卷積類似,可以取'VALID' 或者'SAME'。
返回值介紹:
結果返回一個Tensor,這個輸出,就是我們常說的feature map,shape仍然是 [batch, height, width, channels] 這種形式。
特征圖的行列數計算公式:
對於n*n的矩陣, 使用 f*f 的核進行卷積, 填充寬度為p, 若縱向步幅為s1, 橫向步幅為s2則特征圖的行列數為: