Introduction 对于image-text embedding learning,作者提出了 cross-modal projection matching (CMPM) loss 和 cross-modal projection classification (CMPC) loss ...
Methodology 作者提出TIMAM Text Image Modality Adversarial Matching 方法,比较简洁明了,具体包含三个部分: 特征提取器: 文本采用BERT提取词向量,再输入LSTM提取文本特征 图像采用ResNet 提取特征。 采用ID损失 CMPC换了名 和跨模态投影损失 CMPM ,来拉近相同ID的特征的分布。 采用对抗损失来学习自适应模态的特征表示。 ...
2021-03-14 15:27 0 248 推荐指数:
Introduction 对于image-text embedding learning,作者提出了 cross-modal projection matching (CMPM) loss 和 cross-modal projection classification (CMPC) loss ...
论文原址:https://arxiv.org/abs/1808.08718 代码:https://github.com/JiahuiYu/wdsr_ntire2018 摘要 本文证明在SISR中在ReLU之前特征图越宽,在有效的计算资源及内存条件下,模型的性能越好 ...
github代码地址:https://github.com/mrlibw/ControlGAN 关键词:T2I,文本生成图像,ControlGAN Introduction: 现 ...
一 知识背景 3D scan&cloud points(点云)patch-based features,fully convolutional network, deep metric learning, sparse tensors,sparse convolutions, hard ...
论文源址:https://arxiv.org/abs/1505.04366 tensorflow代码:https://github.com/fabianbormann/Tensorflow-DeconvNet-Segmentation 基于DenconvNet的钢铁分割实验 ...
CVPR21 将图像超分辨率问题转化为寻找图像的连续表示。本质上图像会存在分辨率的问题,是由于其存储和表示使用的是二维数组。如果将图像的表示是一个连续函数,那么图像就可以是任意分辨率的。这个思路受启发于三维重建中的implicit neural representation ...
[论文阅读笔记] Adversarial Learning on Heterogeneous Information Networks 本文结构 解决问题 主要贡献 算法原理 参考文献 (1) 解决问题 现有的异构网络(HIN)嵌入方法本质上可以归结为两个步骤 ...
目录 摘要 一、引言 二、相关工作 投影网络 图卷积网络 逐点多层感知器网络 点卷积网络 三、核点卷积 ...