【文章推薦】聲紋識別算法閱讀之TE2E

原文：聲紋識別算法閱讀之TE2E

論文： ATTENTION BASED MODELS FOR TEXT DEPENDENT SPEAKER VERIFICATION 思想：可以看作是在Google 年提出的d vector算法的改進，采用可學習的帶權重和偏置的cosine得分為減少語句中的噪聲和靜音干擾，對LSTM的輸出引入attention機制，自動學習時序依賴的重要性此外，還對輸出進行了最大池化操作以提升模型時序變 ...

2020-09-12 16:52 0 432 推薦指數：

查看詳情

聲紋識別算法閱讀之GE2E

論文：　　GENERALIZED END-TO-END LOSS FOR SPEAKER VERIFICATION 思想：　　本文是在Google上一篇論文attention-based model(TE2E[1])的基礎上，針對損失函數做的改進，提出了GE2E ...

聲紋識別算法閱讀之VoxCeleb2

論文：　　VoxCeleb2: Deep Speaker Recognition 思想：顯然，VoxCeleb2是在voxceleb基礎上擴充和改進，仍然是兩個貢獻點：　　1）擴大聲紋識別數據集，由voxceleb的1251說話人超過19萬句子，到voxceleb2 ...

聲紋識別算法閱讀之d-vector

論文：　　End-to-End Text-Dependent Speaker Verification 思想：　　google提出的文本相關的說話人確認，通過DNN或L ...

聲紋識別算法閱讀之deep-speaker

論文：　　Deep Speaker: an End-to-End Neural Speaker Embedding System 思想：　　Deep Speaker是百 ...

聲紋識別算法閱讀之x-vector

論文：　　X-VECTORS: ROBUST DNN EMBEDDINGS FOR SPEAKER RECOGNITION 思想：　　X-VECTORS是當前聲紋識別領域主流的baseline模型框架，得益於其網絡中的statistics pooling層 ...

聲紋識別算法閱讀之CN-Celeb

論文: CN-Celeb: A CHALLENGING CHINESE SPEAKER RECOGNITION DATASET 思想：　　論文的貢獻在於提供了一個非約束條件下的大規模中文說話人識別數據集，該數據集包含環境、通道與情感的變化。這是與現目前大多數開源 ...

聲紋識別

聲紋識別，也稱說話人識別，是一種通過聲音判斷說話人身份的技術。聲紋識別可以分為說話人辨識(Speaker Identification, SI)和說話人確認(Speaker Verification, SV)。SI指將待測語音與已知集合內若干說話人比對，選取最為匹配的說話人；而SV指對於一個目標 ...

原文：聲紋識別算法閱讀之TE2E

相關推薦

相關標簽