论文阅读笔记(六十六)【ICCV2019】:Adversarial Representation Learning for Text-to-Image Matching


Methodology

作者提出TIMAM (Text-Image Modality Adversarial Matching)方法,比较简洁明了,具体包含三个部分:

(1)特征提取器:

文本采用BERT提取词向量,再输入LSTM提取文本特征;

图像采用ResNet101提取特征。

(2)采用ID损失(CMPC换了名)和跨模态投影损失(CMPM),来拉近相同ID的特征的分布。

(3)采用对抗损失来学习自适应模态的特征表示。

 

Experiments


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM