【MDNET】:
H Nam, B Han. Learning multi-domain convolutional neural networks for visual tracking[C]. //CVPR2016.
問題1:
解釋:
首先MDNet的網絡結構如下:
input: 107*107@3
conv1: filter:7*7
stride:2*2
output:51*51@96 where,51=(107-7+1)/2
pool1: filter:3*3
stride:2*2
output:25*25@96 where,25=(51-3+1)/2
conv2: filter:5*5
stride:2*2
output:11*11@256 where,11=(25-5+1)/2
pool2: filter:3*3
stride:2*2
output:5*5@256 where,5=(11-3+1)/2
conv3: filter:3*3
stride:1*1
output:3*3@512 where,3=(5-3+1)/1
所以conv3的3就是這么來的,作者的意思是107是它從3逆推計算出的(這里有個問題,為什么作者一定需要conv3的數據輸出大小要是3*3,有什么道理?),並且給了計算公式:
107=75+2*16
下面解釋這個公式怎么來的: