對Joint Training of Cascaded CNN for Face Detection一文的幾點疑惑


最近讀了Joint Training of Cascaded CNN for Face Detection這篇論文,論文中把之前人臉檢測使用到的cascade cnn,從分開訓練的模式,改為了聯合訓練,並且聲稱得到了更好的結果。

但是在我讀論文的過程中,產生了下面幾點疑惑:

1.論文4.2節的Training procedure這部分最后提到,To make it converge easily, we train seperate networks and initialize the joint network with trained weights. 說明聯合網絡利用了分別訓練的模型作為初始權重。這相當於把之前的cascade cnn又訓練了一遍,然后再初始化joint network,訓練步驟其實比之前的cascade cnn更復雜了,而且在分別訓練各個網絡時,采用了怎樣的配置參數,以及訓練的目標,均未提及。

2.論文6.3節中提及該方法在FDDB上測試結果,在false positives=1000 時recall是88.2%,而之前的cascade cnn是85.7%。但是我在FDDB網站上查閱到的CascadeCNN的結果是,false positives=167時recall是0.856701,CascadeCNN提供的測試結果,並沒有false positives=1000的數據。不知道這個85.7%是如何獲得的。

3.2016年上半年有一篇論文Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks,也是利用了類似於CascadeCNN的結構,在FDDB上性能比CascadeCNN好很多(論文的方法是檢測和對齊同時做,但是也提供了只做檢測不做對齊的ROC曲線),而且比這批論文的結果還要好,不知道為何選擇性忽視這篇論文。

4.在網上看到一篇報道,該論文中的算法在單核cpu上可以跑到幾百fps,但是論文里面還僅僅是10fps,一下提高了幾十倍的速度,真的是很神奇,不知道是如何在這么短時間內做到的。

 

上面就是我的幾點疑問,還希望各位高手不吝賜教。

 

參考文獻和網站:

1.http://www.thinkface.cn/thread-4651-1-1.html

2.http://vis-www.cs.umass.edu/fddb/results.html

3.http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Qin_Joint_Training_of_CVPR_2016_paper.pdf

4.http://arxiv.org/pdf/1604.02878

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM