CMUSphinx系列目錄 這一陣子因為個人的某個需求開始研究語音識別 找了一陣子之后決定選擇研究下cmusphinx 下面是官方的介紹 http://cmusphinx.sourceforge.net/wiki/ 現在網上相關資料基本只有官方 ...
CMUSphinx系列目錄 一開始只是因為英文比較差,看不懂沒有字幕的公開課 然后想現在語音識別發展了那么久,能不能用語音識別先做出一套簡陋的英文字幕,然后再通過google翻譯 PS:別鄙視我 翻譯出簡陋的中文字幕。 然后我就來研究了一陣子,目前預想的流程方案是這樣的 首先是提取語音和分割,語音提取應該可以用開源庫FFMPEG,提取語音流 而且記得之前還看到過語音斷句工具,再把之前的語音流斷句 ...
2012-07-12 16:52 3 3739 推薦指數:
CMUSphinx系列目錄 這一陣子因為個人的某個需求開始研究語音識別 找了一陣子之后決定選擇研究下cmusphinx 下面是官方的介紹 http://cmusphinx.sourceforge.net/wiki/ 現在網上相關資料基本只有官方 ...
CMUSphinx系列目錄 如何解決使用別的聲學模型的時候出現的問題 使用別人訓練好的hmm模型的時候一直報以下錯誤(我這里使用的Communica ...
CMUSphinx系列目錄 那我們該如何提高准確率呢? 根據第四章的分析,我們需要建立好一點的語音模型,而好一點的語音模型需要幾個句子或者幾個單詞組合類型做出來的 因為我們統計的概率就是連續的單詞,出現的概率和,出現某個單詞后接着出現另外的單詞的概率 ...
CMUSphinx系列目錄 關於中文識別 網上很多都是學習自下面的博客,Sphinx武林秘籍(上) 但很多人照做之后紛紛表示識別不出來,我們猜測是某個參數設定錯誤或者版本變化導致的 http://www.cnblogs.com/huanghuang ...
書 sphinx語音識別其實是基於統計語言模型的它主要靠language model(lm),Hidden Mar ...
上次簡單地講解了如何利用科大訊飛完成語音合成,今天接着也把語音識別整理一下。當然,寫代碼前我們需要做的一些工作(如申請appid、導庫),在上一篇語音合成的文章當中已經說過了,不了解的可以看看我上次的博文,那么這次直接從堆代碼開始吧。 詳細步驟: 1.導完類庫之后,在工程里添加 ...
上篇博客(語音識別傳統方法(GMM+HMM+NGRAM)概述)說到我們team要做語音識別相關的項目,而我們公司的芯片是用在終端上的,即我們要做終端上的語音識別。由於目前終端(如手機)上的CPU還不足夠強勁,不能讓語音識別的各種算法跑在終端上,尤其現在語音識別都是基於深度學習來做了,更加不能跑 ...
近來在了解卷積神經網絡(CNN),后來查到CNN是受語音信號處理中時延神經網絡(TDNN)影響而發明的。本篇的大部分內容都來自關於TDNN原始文獻【1】的理解和整理。該文寫與1989年,在識別"B", "D", "G"三個濁音中得到98.5%的准確率,高於HMM的93.7%。是CNN的先驅 ...