原文:使用TensorFlow訓練自己的語音識別AI

這次來訓練一個基於CNN的語音識別模型。訓練完成后,我們將嘗試將此模型用於Hotword detection。 人類是怎樣聽懂一句話的呢 以漢語為例,當聽到 wo shi 的錄音時,我們會想,有哪兩個字是讀作 wo shi 的,有人想到的是 我是 ,也有人覺得是 我市 。我們可以通過 wo shi 的頻率的特征,匹配到一些結果,我們這次要訓練的模型,也是基於頻率特征的CNN模型。單純的基於頻率特 ...

2020-02-04 11:35 0 935 推薦指數:

查看詳情

AI語音(一)——語音識別基礎

1 語音識別基礎 1.1 聲音特性 聲音是由物體振動產生的聲波。是通過介質傳播並能被人或動物聽覺器官所感知的波動現象。最初發出振動的物體叫聲源。聲音以波的形式振動傳播。聲音是聲波通過任何介質傳播形成的運動。 頻率:是每秒經過一給定點的聲波數量,它的測量單位為赫茲,1千赫或1000赫表示每秒 ...

Mon Aug 10 05:44:00 CST 2020 0 630
Azure AI 服務之語音識別

筆者在前文《Azure AI 服務之文本翻譯》中簡單介紹了 Azure 認知服務中的文本翻譯 API,通過這些簡單的 REST API 調用就可以輕松地進行機器翻譯。如果能在程序中簡單的集成語音轉文本的功能會不會非常贊!本文我們就介紹如何使用必應的語音識別 API(Bing Speech API ...

Wed May 02 16:22:00 CST 2018 16 13509
AI語音(七)——基於GMM的0-9語音識別系統

點擊上方“AI大道理”,選擇“置頂”公眾號 重磅干貨,細致入微AI大道理 —————— 1 系統概要 孤立詞識別語音中只包含一個單詞的英文識別 識別對象:0-9以及o的英文語音 訓練數據:330句話,每個字符30句話,11個字符 測試數據:110句話,每個字符10句話,11個字符 ...

Fri Aug 28 00:15:00 CST 2020 0 639
AI模型測試】語音識別ASR的結果校對

轉自連接:https://www.cnblogs.com/findyou/p/10646312.html 語音轉文字(ASR)識別完畢后,目前對於各家的結果都是純手工的計算,標注錯別字和漏識字,感覺到很費時費力,少量的還可以,大量的就有點太費勁了。 所以,為了解放自己的勞動力,讓代碼幫忙做更多 ...

Fri Dec 04 00:44:00 CST 2020 1 530
百度AI---語音識別

題記:娛樂性的玩玩百度接口。 說實話,其接口個人覺得有點爛,重試了好幾個音頻文件才成功。 1、重新申請AppID、SecretKey 、API Key。 鏈接:https://console.bce.baidu.com/ai/?fromai=1#/ai/speech/overview ...

Tue Dec 11 06:07:00 CST 2018 0 633
2-GMM-HMMs語音識別系統-訓練

本文記錄在傳統的語音識別中,訓練GMM-HMMs聲學模型過程中的公式推導過程。 Outline GMM - 混合高斯模型 HMM – 隱馬爾科夫模型 Forward-Backward Algorithm – 前向后向算法 首先假設這里的訓練數據,都做 ...

Mon Apr 24 04:04:00 CST 2017 0 1649
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM