rcnn開創性工作,但是計算時間太長,重復計算太大。
spp_net將重復計算避免了。
hcp是yan shuicheng那邊的,是用bing生成regions,然后用normalized cut將這些regions進行聚類,然后將聚類后剩下較小數量的regions進cnn,其實整體思路也是rcnn,只是減少了regions的數量。當然,其工作目的不一樣,其當時這么做主要是為了提高多類分類的效果,如果僅僅這么做會降低檢測的准確率,但是多類分類效果肯定會提高。但是,今年看到他們的Detection工作效果很好,說是用到了contextual information,我在想難道是先多類分類,分出來這張圖片大概有幾類目標,然后再進行檢測定位嗎?如果這樣的話,多類信息怎么在檢測中體現呢?我還沒想明白,他們的slides里也沒說。
由於吧caffe的windows版本調通了。現在spp和rcnn都可以windows下調用了。