一、語音產生的聲學理論 *我們可以有條件的將人的發聲看作是兩個過程: 1.產生聲源(准周期氣流脈沖或白噪聲)去激勵聲道 2.聲道對聲源的調制作用 *我們將把重點放在研究: 1.聲道是怎樣對聲源調制的 2.為什么不同的聲道形狀會產生不同的聲音 ...
轉眼間,已經工作了九個月,從一開始公司的忙碌到壓力,再到如今暫時的穩定,空了就想起了當初申請博客園的初衷,分享創造進步。 出於很多的機緣,接觸語音相關知識,工作九個月,都是在圍繞着語音信號處理展開,比如回聲消除 噪聲抑制 網絡丟包補償等工作。 想想總結還是先從最基本的開始,先從基本的語音模型開始博客園之旅。 語音生成系統 人的發音系統的器官,主要有:聲道和聲帶。 聲道:從聲帶到嘴唇的呼吸通道,聲音 ...
2013-03-18 23:23 0 3080 推薦指數:
一、語音產生的聲學理論 *我們可以有條件的將人的發聲看作是兩個過程: 1.產生聲源(准周期氣流脈沖或白噪聲)去激勵聲道 2.聲道對聲源的調制作用 *我們將把重點放在研究: 1.聲道是怎樣對聲源調制的 2.為什么不同的聲道形狀會產生不同的聲音 ...
前面的文章(語音降噪論文“A Hybrid Approach for Speech Enhancement Using MoG Model and Neural Network Phoneme Classifier”的研讀 )梳理了論文的思想。本篇就開始對其實踐,主要分以下幾步:1,基於一個語料庫 ...
論文: CLDNN: CONVOLUTIONAL, LONG SHORT-TERM MEMORY,FULLY CONNECTED DEEP NEURAL NETWORKS,Google ...
一.下載訓練好的模型 下載路徑:http://kaldi-asr.org/models/m2 二.上傳&配置 1.上傳到kaldi/egs/目錄下 2.解壓,tar -zxvf 0002_cvte_chain_model_v2.tar.gz ...
當前基於深度學習的語音降噪方法主要分為兩個類: 基於TF時頻域的方法 (有兩大類:基於mask和非基於mask的方法) 基於時域的方法,就我自己的實驗結果來說,基於時域的方法比基於TFmask的方法要差一些,可能這樣方法的trick更多一些吧。 基於時頻域方法中 ...
Tacotron模型架構圖 (1) 下載tacotron模型的實現到本地,這里是基於GitHub上一個tacotron模型的實現開展研究的,GitHub網址:https://github.com/keithito/tacotron,由於 谷歌沒有給出tacotron模型的官方實現 ...
上篇文章(基於混合模型的語音降噪實踐)實踐了基於混合模型的算法來做語音降噪,有了一定的降噪效果。本篇說說怎么樣來提升降噪效果。 算法里會算每個音素的高斯模型參數,也會建一個音素分類的神經網絡模型。這些都是依賴於音素對齊的,音素對齊做的越好,每個音素的高斯模型越准確,音素分類模型越收斂准確率 ...
出任意類型的分布? AI大語音:不僅GMM可以,只要性質不太奇怪的混合模型一般都能近似任意分布。這個 ...