原文:聲紋識別算法閱讀之d-vector

論文: End to End Text Dependent Speaker Verification 思想: google提出的文本相關的說話人確認,通過DNN或LSTM的網絡結構提取說話人特征表達 然后注冊階段輸入說話人的多個文本相關句子 考慮環境噪聲等干擾 得到的特征表達取平均值作為該說話人的embedding 然后驗證時輸入test句子得到特征表達后,與說話人注冊embedding計算co ...

2020-09-12 16:35 0 849 推薦指數:

查看詳情

聲紋識別算法閱讀之x-vector

論文:   X-VECTORS: ROBUST DNN EMBEDDINGS FOR SPEAKER RECOGNITION 思想:   X-VECTORS是當前聲紋識別領域主流的baseline模型框架,得益於其網絡中的statistics pooling層 ...

Sun Sep 13 01:35:00 CST 2020 0 2958
聲紋識別算法閱讀之VoxCeleb2

論文:   VoxCeleb2: Deep Speaker Recognition 思想:顯然,VoxCeleb2是在voxceleb基礎上擴充和改進,仍然是兩個貢獻點:   1)擴大聲紋識別數據集,由voxceleb的1251說話人超過19萬句子,到voxceleb2 ...

Sun Sep 13 00:25:00 CST 2020 0 1009
聲紋識別算法閱讀之self-attentive x-vector

論文:   Self-Attentive Speaker Embeddings for Text-Independent Speaker Verification 思想:   本文主要是對x-vector的統計池化結構進行改進,引入self-attention機制,得到 ...

Sun Sep 13 01:42:00 CST 2020 0 591
聲紋識別算法閱讀之TE2E

論文:   ATTENTION-BASED MODELS FOR TEXT-DEPENDENT SPEAKER VERIFICATION 思想:   可以看作是在Google15年提出的d-vector算法的改進,   1)采用可學習的帶權重和偏置的cosine ...

Sun Sep 13 00:52:00 CST 2020 0 432
聲紋識別算法閱讀之GE2E

論文:   GENERALIZED END-TO-END LOSS FOR SPEAKER VERIFICATION 思想:   本文是在Google上一篇論文attent ...

Sun Sep 13 01:11:00 CST 2020 1 1051
聲紋識別算法閱讀之CN-Celeb

論文: CN-Celeb: A CHALLENGING CHINESE SPEAKER RECOGNITION DATASET 思想:   論文的貢獻在於提供了一個非約束條件下的大規模中文說話人識別數據集,該數據集包含環境、通道與情感的變化。這是與現目前大多數開源 ...

Wed Sep 23 06:31:00 CST 2020 1 901
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM