語音識別,可以分為在線識別,離線命令詞,及喚醒詞
在線識別: 即聯網使用的識別功能,支持自定義詞庫及自訓練平台。目前在線識別支持普通話、英文、粵語和四川話,通過在請求時配置不同的pid參數,選擇對應模型。默認為麥克風輸入,可以設置參數為pcm格式16k采樣率,16bit,小端序,單聲道的音頻流輸入。
離線命令詞: 斷網時識別固定的預定義短語(定義在bsg文件中),SDK強制優先使用在線識別。 斷網時激活,只能識別預定義的短語。聯網時,強制使用在線識別。固定短語的語法需要從控制台“離線詞&本地語義”模塊預定義並下載為baidu_speech_grammar.bsg文件
喚醒詞:識別預定義的“關鍵詞”, 這個“關鍵詞”必須在一句話的開頭。 本地功能,不需要網絡。喚醒詞即識別“關鍵詞”,當SDK的識別引擎“聽到”錄音中的關鍵詞后,立即告知用戶。與android系統的鎖屏喚醒完全無關。關鍵詞和離線命令詞一樣,需要預定義並下載為WakeUp.bin文件