【文章推薦】語音模型--產生模型與聽覺模型

原文：語音模型--產生模型與聽覺模型

轉眼間，已經工作了九個月，從一開始公司的忙碌到壓力，再到如今暫時的穩定，空了就想起了當初申請博客園的初衷，分享創造進步。出於很多的機緣，接觸語音相關知識，工作九個月，都是在圍繞着語音信號處理展開，比如回聲消除噪聲抑制網絡丟包補償等工作。想想總結還是先從最基本的開始，先從基本的語音模型開始博客園之旅。語音生成系統人的發音系統的器官，主要有：聲道和聲帶。聲道：從聲帶到嘴唇的呼吸通道，聲音 ...

2013-03-18 23:23 0 3080 推薦指數：

查看詳情

語音產生機理及語音生成模型（一）

一、語音產生的聲學理論 *我們可以有條件的將人的發聲看作是兩個過程： 1.產生聲源(准周期氣流脈沖或白噪聲）去激勵聲道 2.聲道對聲源的調制作用 *我們將把重點放在研究： 1.聲道是怎樣對聲源調制的 2.為什么不同的聲道形狀會產生不同的聲音 ...

基於混合模型的語音降噪實踐

前面的文章（語音降噪論文“A Hybrid Approach for Speech Enhancement Using MoG Model and Neural Network Phoneme Classifier”的研讀）梳理了論文的思想。本篇就開始對其實踐，主要分以下幾步：1，基於一個語料庫 ...

語音識別模型閱讀之CLDNN

論文：　　CLDNN: CONVOLUTIONAL, LONG SHORT-TERM MEMORY,FULLY CONNECTED DEEP NEURAL NETWORKS,Google ...

Kaldi語音識別CVTE模型實戰

一.下載訓練好的模型　　下載路徑：http://kaldi-asr.org/models/m2 　　二.上傳&配置　　1.上傳到kaldi/egs/目錄下　　　　2.解壓，tar -zxvf 0002_cvte_chain_model_v2.tar.gz ...

訓練語音降噪模型的一些感想

當前基於深度學習的語音降噪方法主要分為兩個類：基於TF時頻域的方法（有兩大類：基於mask和非基於mask的方法）基於時域的方法，就我自己的實驗結果來說，基於時域的方法比基於TFmask的方法要差一些，可能這樣方法的trick更多一些吧。基於時頻域方法中 ...

基於Tacotron模型的語音合成實踐

Tacotron模型架構圖（1）下載tacotron模型的實現到本地，這里是基於GitHub上一個tacotron模型的實現開展研究的，GitHub網址：https://github.com/keithito/tacotron，由於谷歌沒有給出tacotron模型的官方實現 ...

基於混合模型的語音降噪效果提升

上篇文章（基於混合模型的語音降噪實踐）實踐了基於混合模型的算法來做語音降噪，有了一定的降噪效果。本篇說說怎么樣來提升降噪效果。算法里會算每個音素的高斯模型參數，也會建一個音素分類的神經網絡模型。這些都是依賴於音素對齊的，音素對齊做的越好，每個音素的高斯模型越准確，音素分類模型越收斂准確率 ...

AI大語音（六）——混合高斯模型（GMM）

出任意類型的分布？ AI大語音：不僅GMM可以，只要性質不太奇怪的混合模型一般都能近似任意分布。這個 ...

原文：語音模型--產生模型與聽覺模型

相關推薦

相關標簽