原文:声纹识别算法阅读之self-attentive x-vector

论文: Self Attentive Speaker Embeddings for Text Independent Speaker Verification 思想: 本文主要是对x vector的统计池化结构进行改进,引入self attention机制,得到带权重的均值和标准方差,这样一方面可以学习时序特征的重要性,另一方面可以有效降低噪声和静音等干扰,因而取得了比之x vector更好的效 ...

2020-09-12 17:42 0 591 推荐指数:

查看详情

声纹识别算法阅读x-vector

论文:   X-VECTORS: ROBUST DNN EMBEDDINGS FOR SPEAKER RECOGNITION 思想:   X-VECTORS是当前声纹识别领域主流的baseline模型框架,得益于其网络中的statistics pooling层 ...

Sun Sep 13 01:35:00 CST 2020 0 2958
声纹识别算法阅读之d-vector

论文:   End-to-End Text-Dependent Speaker Verification 思想:   google提出的文本相关的说话人确认,通过DNN或L ...

Sun Sep 13 00:35:00 CST 2020 0 849
声纹识别算法阅读之VoxCeleb2

论文:   VoxCeleb2: Deep Speaker Recognition 思想:显然,VoxCeleb2是在voxceleb基础上扩充和改进,仍然是两个贡献点:   1)扩大声纹识别数据集,由voxceleb的1251说话人超过19万句子,到voxceleb2 ...

Sun Sep 13 00:25:00 CST 2020 0 1009
声纹识别算法阅读之TE2E

论文:   ATTENTION-BASED MODELS FOR TEXT-DEPENDENT SPEAKER VERIFICATION 思想:   可以看作是在Google15年提出的d-vector算法的改进,   1)采用可学习的带权重和偏置的cosine ...

Sun Sep 13 00:52:00 CST 2020 0 432
声纹识别算法阅读之GE2E

论文:   GENERALIZED END-TO-END LOSS FOR SPEAKER VERIFICATION 思想:   本文是在Google上一篇论文attent ...

Sun Sep 13 01:11:00 CST 2020 1 1051
声纹识别算法阅读之CN-Celeb

论文: CN-Celeb: A CHALLENGING CHINESE SPEAKER RECOGNITION DATASET 思想:   论文的贡献在于提供了一个非约束条件下的大规模中文说话人识别数据集,该数据集包含环境、通道与情感的变化。这是与现目前大多数开源 ...

Wed Sep 23 06:31:00 CST 2020 1 901
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM