語音識別


語音識別,可以分為在線識別,離線命令詞,及喚醒詞

在線識別: 即聯網使用的識別功能,支持自定義詞庫及自訓練平台。目前在線識別支持普通話、英文、粵語和四川話,通過在請求時配置不同的pid參數,選擇對應模型。默認為麥克風輸入,可以設置參數為pcm格式16k采樣率,16bit,小端序,單聲道的音頻流輸入。
離線命令詞: 斷網時識別固定的預定義短語(定義在bsg文件中),SDK強制優先使用在線識別。 斷網時激活,只能識別預定義的短語。聯網時,強制使用在線識別。固定短語的語法需要從控制台“離線詞&本地語義”模塊預定義並下載為baidu_speech_grammar.bsg文件
喚醒詞:識別預定義的“關鍵詞”, 這個“關鍵詞”必須在一句話的開頭。 本地功能,不需要網絡。喚醒詞即識別“關鍵詞”,當SDK的識別引擎“聽到”錄音中的關鍵詞后,立即告知用戶。與android系統的鎖屏喚醒完全無關。關鍵詞和離線命令詞一樣,需要預定義並下載為WakeUp.bin文件


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM