原文:【CV論文閱讀】Dynamic image networks for action recognition

論文的重點在於后面approximation部分。 在 Rank Pooling 的論文中提到,可以通過訓練RankSVM獲得參數向量d,來作為視頻幀序列的representation。而在dynamic論文中發現,這樣的參數向量d,事實上與image是同等大小的,也就是說,它本身是一張圖片 假如map與image同大小而不是提取的特征向量 ,那么就可以把圖片輸入到CNN中進行計算了。如下圖可以看 ...

2016-08-15 16:37 0 1452 推薦指數:

查看詳情

CV論文閱讀】Two stream convolutional Networks for action recognition in Vedios

論文的三個貢獻 (1)提出了two-stream結構的CNN,由空間和時間兩個維度的網絡組成。 (2)使用多幀的密集光流場作為訓練輸入,可以提取動作的信息。 (3)利用了多任務訓練的方法把兩個數據集聯合起來。 Two stream結構 視屏可以分成空間與時間兩個部分,空間部分指獨立 ...

Sun Aug 07 17:01:00 CST 2016 0 9206
CV論文閱讀】Rank Pooling for Action Recognition

這是期刊論文的版本,不是會議論文的版本。看了論文之后,只能說,太TM聰明了。膜拜~~ 視頻的表示方法有很多,一般是把它看作幀的序列。論文提出一種新的方法去表示視頻,用ranking function的參數編碼視頻的幀序列。它使用一個排序函數(ranking function)主要 ...

Wed Aug 10 18:15:00 CST 2016 0 2928
CV論文閱讀Image Captioning 總結

初次接觸Captioning的問題,第一印象就是Andrej Karpathy好聰明。主要從他的兩篇文章開始入門,《Deep Fragment Embeddings for Bidirectional Image Sentence Mapping》和《Deep Visual-Semantic ...

Sun Nov 20 07:51:00 CST 2016 7 8791
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM