語音識別LD3320


 

 

一、概述

1.芯片介紹

 LD3320 是一顆基於非特定人語音識(SI-ASR:Speaker-Independent  Automatic Speech Recognition)技術的語音識/聲控芯片。提供了真正的單 芯片語音識解決方案。   

 LD3320 芯片上集成了高精度的 A/D 和 D/A 接口,不再需要外接輔助的 Flash 和 RAM,即可以實現語音識/聲控/人機對話功能。並且,識的關鍵詞 語列表是可以動態編輯的。    

基於 LD3320,可以在任何的電子產品中,甚至包括最簡單的 51 作為主控 芯片的系統中,輕松實現語音識/聲控/人機對話功能。為所有的電子產品增 加 VUI(Voice User Interface)語音用戶操作界面。

2.語音識別介紹

語音識 ASR 技術,是基於關鍵詞語列表識的技術。只需要設定好要識 別的關鍵詞語列表,並把這些關鍵詞語以字符的形式傳送到 LD3320 內部,就可 以對用戶說出的關鍵詞語進行識別。不需要用戶作任何地錄音訓練。

ASR 技術最重要的現實意義就在於提供了一種脫離按鍵,鍵盤,鼠標的基 於語音的用戶界面 VUI:Voice User Interface

每次識的過程,就是把用戶說出的語音內容,通過頻譜轉換為語音特 征,和這個關鍵詞語列表中的條目進行一一匹配,最優匹配的一條作為識結 果。比如在手機的應用中,這個關鍵詞語列表的內容就是電話本中的人名/手機 的菜單命令/T 卡中的歌曲名字。   不論這個列表的條目內容是什么,只需要用戶設置相關的寄存器,就可以 把相應的待識條目內容以字符形式傳遞給識引擎。 
  LD3320 可以識列表中的關鍵詞,用戶說的語音可以是這個列表中任意的 關鍵詞語,而且不需要用戶在識前進行任何訓練。   識引擎不關心關鍵詞語列表中的關鍵詞語的內容,可以是命令,人名, 歌曲名字,操作指令等等任何的漢字字符串。     每條關鍵詞語最大可以支持的字數,從算法角度是限制在 30 字以內。但是 從實際情況來看,用戶一口氣說超過 8 個字以上的條目時,幾乎肯定會出現說 錯字/說漏字/說多字/打嗝/停頓等情況,這些情況都會嚴重影響識並造成識 錯誤。因而一般來說,如果要獲得理想的識效果,建議每條關鍵詞語的字 數不要過長,避免影響效果。  

3.技術參數

1. 內置單聲道 mono 16-bit A/D 模數轉換

2. 內置雙聲道 stereo 16-bit D/A 數模轉換

3. 內置 20mW 雙聲道耳機放大器輸出

4. 內置 550mW 單聲道揚聲器放大器輸出

5. 支持並行接口或者 SPI 接口

6. 內置鎖相電路 PLL,輸入主控時鍾頻率為 2MHz - 34MHz

7. 工作電壓:(VDD: for internal core) 3.3V

8. 48pin 的 QFN 7*7 標准封裝

9. 省電模式耗電:1uA  

4.應用場景

 電磁爐/微波爐/智能家電操作

 導航儀 

MP3/MP4 

數碼像框 

機頂盒/彩電遙控器

智能玩具/對話玩具 

PMP/游戲機 

自動售貨機

地鐵自動售票機

導游機

樓宇電視的廣告點播

公共照明系統/衛生系統/智能家居的聲控

二、LD3320 資料

1.管腳

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM