原文:【CV論文閱讀】Image Captioning 總結

初次接觸Captioning的問題,第一印象就是Andrej Karpathy好聰明。主要從他的兩篇文章開始入門, Deep Fragment Embeddings for Bidirectional Image Sentence Mapping 和 Deep Visual Semantic Alignments for Generating Image Descriptions 。基本上,第一篇 ...

2016-11-19 23:51 7 8791 推薦指數:

查看詳情

CV論文閱讀】Dynamic image networks for action recognition

論文的重點在於后面approximation部分。 在《Rank Pooling》的論文中提到,可以通過訓練RankSVM獲得參數向量d,來作為視頻幀序列的representation。而在dynamic論文中發現,這樣的參數向量d,事實上與image是同等大小的,也就是說,它本身是一張 ...

Tue Aug 16 00:37:00 CST 2016 0 1452
Image Captioning 經典論文合輯

Image Caption: Automatically describing the content of an image domain:CV+NLP Category:(by myself, you can read the survey for detail.) CNN+RNN ...

Sat Nov 03 01:50:00 CST 2018 0 2941
CV論文閱讀】Going deeper with convolutions(GoogLeNet)

目的: 提升深度神經網絡的性能。 一般方法帶來的問題: 增加網絡的深度與寬度。 帶來兩個問題: (1)參數增加,數據不足的情況容易導致過擬合 (2)計算資源要求高,而且在訓練過程中會 ...

Tue Aug 02 04:17:00 CST 2016 0 3640
CV論文閱讀】Rank Pooling for Action Recognition

這是期刊論文的版本,不是會議論文的版本。看了論文之后,只能說,太TM聰明了。膜拜~~ 視頻的表示方法有很多,一般是把它看作幀的序列。論文提出一種新的方法去表示視頻,用ranking function的參數編碼視頻的幀序列。它使用一個排序函數(ranking function)主要 ...

Wed Aug 10 18:15:00 CST 2016 0 2928
視頻描述(Video Captioning)近年重要論文總結

視頻描述 顧名思義視頻描述是計算機對視頻生成一段描述,如圖所示,這張圖片選取了一段視頻的兩幀,針對它的描述是"A man is doing stunts on his bike",這對在線的視頻的檢 ...

Tue Feb 25 22:57:00 CST 2020 0 1637
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM