论文地址: https://arxiv.org/abs/2002.10137 概述 Talking face generation, 给定一段语音, 我们需要生成一段视频, 这段视频中的人的表情, 姿势要和语音中相互对应, 该任务的核心在于, 将语音信息转化为视频中人嘴唇和表情的变化 ...
论文阅读 Hierarchical Cross Modal Talking Face Generation with Dynamic Pixel Wise Loss 论文链接: http: openaccess.thecvf.com content CVPR html Chen Hierarchical Cross Modal Talking Face Generation With Dynami ...
2020-06-18 15:34 0 585 推荐指数:
论文地址: https://arxiv.org/abs/2002.10137 概述 Talking face generation, 给定一段语音, 我们需要生成一段视频, 这段视频中的人的表情, 姿势要和语音中相互对应, 该任务的核心在于, 将语音信息转化为视频中人嘴唇和表情的变化 ...
Introduction 对于image-text embedding learning,作者提出了 cross-modal projection matching (CMPM) loss 和 cross-modal projection classification (CMPC) loss ...
OPT: Omni-Perception Pre-Trainer for Cross-Modal Understanding and Generation 2021-07-21 20:23:07 Paper: https://arxiv.org/pdf/2107.00249.pdf ...
Learning Cross-Modal Deep Representations for Robust Pedestrian Detection 2017-04-11 19:40:22 Motivation: 本文主要是考虑了在光照极端恶劣的情况下,如何充分的利用 ...
Deep Supervised Cross-modal Retrieval 摘要 在本文中提出了一种新颖的跨模式检索方法,称为深度监督跨模式检索(Deep Supervised Cross-modal Retrieval, DSCMR)。它旨在找到一个通用的表示空间,在其中可以直接比较来自 ...
本文来自李纪为博士的论文 Deep Reinforcement Learning for Dialogue Generation。 1,概述 当前在闲聊机器人中的主要技术框架都是seq2seq模型。但传统的seq2seq存在很多问题。本文就提出了两个问题: 1)传统 ...
Introduction 本文主要解决RGB-IR跨模态匹配问题。贡献主要有三部分组成: ① 提出了 Hierarchical Cross-Modality Disentanglement(Hi-CMD)方法,该模块的目的是排除姿态、光照这些冗余特征(ID-excluded)的影响,提取 ...
Hierarchical Object Detection with Deep Reinforcement Learning NIPS 2016 WorkShop Paper : https://arxiv.org/pdf/1611.03718v1.pdf ...