論文筆記【MDNet//CVPR2016】


【MDNET】:

H Nam, B Han. Learning multi-domain convolutional neural networks for visual tracking[C]. //CVPR2016.

 

問題1:

解釋:

首先MDNet的網絡結構如下:

input: 107*107@3

conv1: filter:7*7

            stride:2*2

            output:51*51@96  where,51=(107-7+1)/2

pool1: filter:3*3

           stride:2*2

            output:25*25@96    where,25=(51-3+1)/2

conv2: filter:5*5

            stride:2*2

            output:11*11@256  where,11=(25-5+1)/2

pool2: filter:3*3

           stride:2*2

            output:5*5@256    where,5=(11-3+1)/2

conv3: filter:3*3

            stride:1*1

            output:3*3@512  where,3=(5-3+1)/1

 

所以conv3的3就是這么來的,作者的意思是107是它從3逆推計算出的(這里有個問題,為什么作者一定需要conv3的數據輸出大小要是3*3,有什么道理?),並且給了計算公式:

107=75+2*16

下面解釋這個公式怎么來的:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM