在Fully Convolutional Networks(FCN)中,會用到Crop 層,他的主要作用是進行裁切。下面我們舉一個例子來說明如何使用Crop 層。
Caffe中的數據是以 blobs形式存在的,blob是四維數據,即 (Batch size, number of Chennels, Height, Width)=(N, C, H, W)。---(0,1,2,3)
Crop層的輸入(bottom blobs)有兩個,讓我們假設為A和B,輸出(top)為C。
- A是要進行裁切的bottom,他的size是 (20,50,512,512)
- B是裁切的參考輸入,他的size是(20,10,256,256)
- C是輸出(top blob),由A裁切而來,那么他的size是(20,10,256,256)
在這個例子中,軸0的維度不變,我們只需要裁切blob的軸1,2,3,所以我們設置axis=1,代表我們將會裁切軸1和它之后的所有軸。
有兩個裁切模式:
模式1---給出3個offsets,每個針對一個dimension,offset=(25,128,128)
- axis=1,offset=(25,128,128)
- crop operation: C = A[: , 25: 25+B.shape[1] , 128: 128+B.shape[2] , 128: 128+B.shape[3] ]
- 也就是說,對於A的軸1,對稱裁切了25-35
- 對稱裁切:offset = (Original_length - desired length ) / 2
模式2---給出1個offset,適用於三個dimension,offset=25
- 那么就相當於模式1 的 offset=(25,25,25)
模式1的prototxt寫法如下:
layer { name: "crop_layer" type: "Crop" bottom: "A" bottom: "B" top: "C" crop_param { axis: 1 offset: 25 offset: 128 offset: 128 } }