【文章推薦】聲紋識別算法閱讀之x-vector

原文：聲紋識別算法閱讀之x-vector

論文： X VECTORS: ROBUST DNN EMBEDDINGS FOR SPEAKER RECOGNITION 思想： X VECTORS是當前聲紋識別領域主流的baseline模型框架，得益於其網絡中的statistics pooling層，X VECTORS可接受任意長度的輸入，轉化為固定長度的特征表達此外，在訓練中引入了包含噪聲和混響在內的數據增強策略，使得模型對於噪聲和混響等 ...

2020-09-12 17:35 0 2958 推薦指數：

查看詳情

聲紋識別算法閱讀之self-attentive x-vector

論文：　　Self-Attentive Speaker Embeddings for Text-Independent Speaker Verification 思想：　　本文主要是對x-vector的統計池化結構進行改進，引入self-attention機制，得到 ...

聲紋識別算法閱讀之d-vector

論文：　　End-to-End Text-Dependent Speaker Verification 思想：　　google提出的文本相關的說話人確認，通過DNN或L ...

聲紋識別算法閱讀之VoxCeleb2

論文：　　VoxCeleb2: Deep Speaker Recognition 思想：顯然，VoxCeleb2是在voxceleb基礎上擴充和改進，仍然是兩個貢獻點：　　1）擴大聲紋識別數據集，由voxceleb的1251說話人超過19萬句子，到voxceleb2 ...

聲紋識別算法閱讀之TE2E

論文：　　ATTENTION-BASED MODELS FOR TEXT-DEPENDENT SPEAKER VERIFICATION 思想：　　可以看作是在Google15年提出的d-vector算法的改進，　　1）采用可學習的帶權重和偏置的cosine ...

聲紋識別算法閱讀之GE2E

論文：　　GENERALIZED END-TO-END LOSS FOR SPEAKER VERIFICATION 思想：　　本文是在Google上一篇論文attent ...

聲紋識別算法閱讀之deep-speaker

論文：　　Deep Speaker: an End-to-End Neural Speaker Embedding System 思想：　　Deep Speaker是百 ...

聲紋識別算法閱讀之CN-Celeb

論文: CN-Celeb: A CHALLENGING CHINESE SPEAKER RECOGNITION DATASET 思想：　　論文的貢獻在於提供了一個非約束條件下的大規模中文說話人識別數據集，該數據集包含環境、通道與情感的變化。這是與現目前大多數開源 ...

原文：聲紋識別算法閱讀之x-vector

相關推薦

相關標簽