Introduction 對於image-text embedding learning,作者提出了 cross-modal projection matching (CMPM) loss 和 cross-modal projection classification (CMPC) loss ...
Methodology 作者提出TIMAM Text Image Modality Adversarial Matching 方法,比較簡潔明了,具體包含三個部分: 特征提取器: 文本采用BERT提取詞向量,再輸入LSTM提取文本特征 圖像采用ResNet 提取特征。 采用ID損失 CMPC換了名 和跨模態投影損失 CMPM ,來拉近相同ID的特征的分布。 采用對抗損失來學習自適應模態的特征表示。 ...
2021-03-14 15:27 0 248 推薦指數:
Introduction 對於image-text embedding learning,作者提出了 cross-modal projection matching (CMPM) loss 和 cross-modal projection classification (CMPC) loss ...
論文原址:https://arxiv.org/abs/1808.08718 代碼:https://github.com/JiahuiYu/wdsr_ntire2018 摘要 本文證明在SISR中在ReLU之前特征圖越寬,在有效的計算資源及內存條件下,模型的性能越好 ...
github代碼地址:https://github.com/mrlibw/ControlGAN 關鍵詞:T2I,文本生成圖像,ControlGAN Introduction: 現 ...
一 知識背景 3D scan&cloud points(點雲)patch-based features,fully convolutional network, deep metric learning, sparse tensors,sparse convolutions, hard ...
論文源址:https://arxiv.org/abs/1505.04366 tensorflow代碼:https://github.com/fabianbormann/Tensorflow-DeconvNet-Segmentation 基於DenconvNet的鋼鐵分割實驗 ...
CVPR21 將圖像超分辨率問題轉化為尋找圖像的連續表示。本質上圖像會存在分辨率的問題,是由於其存儲和表示使用的是二維數組。如果將圖像的表示是一個連續函數,那么圖像就可以是任意分辨率的。這個思路受啟發於三維重建中的implicit neural representation ...
[論文閱讀筆記] Adversarial Learning on Heterogeneous Information Networks 本文結構 解決問題 主要貢獻 算法原理 參考文獻 (1) 解決問題 現有的異構網絡(HIN)嵌入方法本質上可以歸結為兩個步驟 ...
目錄 摘要 一、引言 二、相關工作 投影網絡 圖卷積網絡 逐點多層感知器網絡 點卷積網絡 三、核點卷積 ...