語音識別

本文轉載自查看原文 2022-03-29 09:54 887

語音識別，可以分為在線識別，離線命令詞，及喚醒詞

在線識別：即聯網使用的識別功能，支持自定義詞庫及自訓練平台。目前在線識別支持普通話、英文、粵語和四川話，通過在請求時配置不同的pid參數，選擇對應模型。默認為麥克風輸入，可以設置參數為pcm格式16k采樣率，16bit，小端序，單聲道的音頻流輸入。
離線命令詞：斷網時識別固定的預定義短語（定義在bsg文件中），SDK強制優先使用在線識別。斷網時激活，只能識別預定義的短語。聯網時，強制使用在線識別。固定短語的語法需要從控制台“離線詞&本地語義”模塊預定義並下載為baidu_speech_grammar.bsg文件
喚醒詞：識別預定義的“關鍵詞”，這個“關鍵詞”必須在一句話的開頭。本地功能，不需要網絡。喚醒詞即識別“關鍵詞”，當SDK的識別引擎“聽到”錄音中的關鍵詞后，立即告知用戶。與android系統的鎖屏喚醒完全無關。關鍵詞和離線命令詞一樣，需要預定義並下載為WakeUp.bin文件

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 語音識別概述 JavaScript的語音識別語音識別-TDNN Python 語音識別語音識別 -- 概述語音識別基礎基於android的語音識別語音識別: DeepSpeech2 樹莓派的語音識別（四）語音識別測試案例