轉眼間,已經工作了九個月,從一開始公司的忙碌到壓力,再到如今暫時的穩定,空了就想起了當初申請博客園的初衷,分享創造進步。 出於很多的機緣,接觸語音相關知識,工作九個月,都是在圍繞着語音信號處理展開,比如回聲消除、噪聲抑制、網絡丟包補償等工作。 想想總結還是先從最基本的開始,先從基本的語音模型 ...
一 語音產生的聲學理論 我們可以有條件的將人的發聲看作是兩個過程: .產生聲源 准周期氣流脈沖或白噪聲 去激勵聲道 .聲道對聲源的調制作用 我們將把重點放在研究: .聲道是怎樣對聲源調制的 .為什么不同的聲道形狀會產生不同的聲音 研究思路:將復雜的問題分解為簡單問題的集合,通過解決簡單的問題,從而達到解決難題。 我們可以將聲道視為截面積變化的管子,通過將聲道離散化 類似高數中積分的思想 為單個管子 ...
2020-11-01 00:17 0 517 推薦指數:
轉眼間,已經工作了九個月,從一開始公司的忙碌到壓力,再到如今暫時的穩定,空了就想起了當初申請博客園的初衷,分享創造進步。 出於很多的機緣,接觸語音相關知識,工作九個月,都是在圍繞着語音信號處理展開,比如回聲消除、噪聲抑制、網絡丟包補償等工作。 想想總結還是先從最基本的開始,先從基本的語音模型 ...
亞穩態的產生機理、消除辦法 (可以理解為什么打拍) https://blog.csdn.net/gordon_77/article/details/79483119 1. 應用背景 1.1 亞穩態發生原因 在FPGA系統中,如果數據傳輸中不滿足觸發器 ...
用我們的算法,讓它消失的無影無蹤。 嘯叫的原因 簡單來說,嘯叫產生的原因為有以下三點: ...
1.1 亞穩態發生原因 在FPGA系統中,如果數據傳輸中不滿足觸發器的Tsu和Th不滿足,或者復位過程中復位信號的釋放相對於有效時鍾沿的恢復時間(recovery time)不滿足,就可能產生亞穩態,此時觸發器輸出端Q在有效時鍾沿之后比較長的一段時間處於不確定的狀態 ...
前面的文章(語音降噪論文“A Hybrid Approach for Speech Enhancement Using MoG Model and Neural Network Phoneme Classifier”的研讀 )梳理了論文的思想。本篇就開始對其實踐,主要分以下幾步:1,基於一個語料庫 ...
Tacotron模型架構圖 (1) 下載tacotron模型的實現到本地,這里是基於GitHub上一個tacotron模型的實現開展研究的,GitHub網址:https://github.com/keithito/tacotron,由於 谷歌沒有給出tacotron模型的官方實現 ...
上篇文章(基於混合模型的語音降噪實踐)實踐了基於混合模型的算法來做語音降噪,有了一定的降噪效果。本篇說說怎么樣來提升降噪效果。 算法里會算每個音素的高斯模型參數,也會建一個音素分類的神經網絡模型。這些都是依賴於音素對齊的,音素對齊做的越好,每個音素的高斯模型越准確,音素分類模型越收斂准確率 ...
出任意類型的分布? AI大語音:不僅GMM可以,只要性質不太奇怪的混合模型一般都能近似任意分布。這個 ...