原文:Sphinx語音識別學習記錄 (六)-我的目標和幾個想像的方案(閑置中)

CMUSphinx系列目錄 一開始只是因為英文比較差,看不懂沒有字幕的公開課 然后想現在語音識別發展了那么久,能不能用語音識別先做出一套簡陋的英文字幕,然后再通過google翻譯 PS:別鄙視我 翻譯出簡陋的中文字幕。 然后我就來研究了一陣子,目前預想的流程方案是這樣的 首先是提取語音和分割,語音提取應該可以用開源庫FFMPEG,提取語音流 而且記得之前還看到過語音斷句工具,再把之前的語音流斷句 ...

2012-07-12 16:52 3 3739 推薦指數:

查看詳情

Sphinx語音識別學習記錄 (一)-基本運行測試

CMUSphinx系列目錄 這一陣子因為個人的某個需求開始研究語音識別 找了一陣子之后決定選擇研究下cmusphinx 下面是官方的介紹 http://cmusphinx.sourceforge.net/wiki/ 現在網上相關資料基本只有官方 ...

Thu Jun 21 18:27:00 CST 2012 2 6488
Sphinx語音識別學習記錄 (五)-錯誤調試

CMUSphinx系列目錄 如何解決使用別的聲學模型的時候出現的問題 使用別人訓練好的hmm模型的時候一直報以下錯誤(我這里使用的Communica ...

Sat Jun 23 01:41:00 CST 2012 1 4406
Sphinx語音識別學習記錄 (三)-小范圍語音英文識別

CMUSphinx系列目錄 那我們該如何提高准確率呢? 根據第四章的分析,我們需要建立好一點的語音模型,而好一點的語音模型需要幾個句子或者幾個單詞組合類型做出來的 因為我們統計的概率就是連續的單詞,出現的概率和,出現某個單詞后接着出現另外的單詞的概率 ...

Thu Jul 12 17:10:00 CST 2012 1 4335
Sphinx語音識別學習記錄 (四)-小范圍語音中文識別

CMUSphinx系列目錄 關於中文識別 網上很多都是學習自下面的博客,Sphinx武林秘籍(上) 但很多人照做之后紛紛表示識別不出來,我們猜測是某個參數設定錯誤或者版本變化導致的 http://www.cnblogs.com/huanghuang ...

Thu Jul 12 23:29:00 CST 2012 26 34940
IOS開發學習筆記(二) 語音識別

上次簡單地講解了如何利用科大訊飛完成語音合成,今天接着也把語音識別整理一下。當然,寫代碼前我們需要做的一些工作(如申請appid、導庫),在上一篇語音合成的文章當中已經說過了,不了解的可以看看我上次的博文,那么這次直接從堆代碼開始吧。 詳細步驟: 1.導完類庫之后,在工程里添加 ...

Sun Jul 20 16:45:00 CST 2014 13 3818
語音識別喚醒技術調研

上篇博客(語音識別傳統方法(GMM+HMM+NGRAM)概述)說到我們team要做語音識別相關的項目,而我們公司的芯片是用在終端上的,即我們要做終端上的語音識別。由於目前終端(如手機)上的CPU還不足夠強勁,不能讓語音識別的各種算法跑在終端上,尤其現在語音識別都是基於深度學習來做了,更加不能跑 ...

Wed May 29 06:26:00 CST 2019 2 1883
語音識別-TDNN

近來在了解卷積神經網絡(CNN),后來查到CNN是受語音信號處理時延神經網絡(TDNN)影響而發明的。本篇的大部分內容都來自關於TDNN原始文獻【1】的理解和整理。該文寫與1989年,在識別"B", "D", "G"三個濁音得到98.5%的准確率,高於HMM的93.7%。是CNN的先驅 ...

Mon Jan 14 01:11:00 CST 2019 0 1274
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM