python語音識別入門及實踐


單。閱讀本指南,你就將會了解。你將學到:

•語音識別的工作原理;

•PyPI 支持哪些軟件包; 

•如何安裝和使用 SpeechRecognition 軟件包——一個功能全面且易於使用的 Python 語音識別庫。

選擇 Python 語音識別包

PyPI中有一些現成的語音識別軟件包。其中包括:

 

•apiai

•google-cloud-speech

•pocketsphinx

•SpeechRcognition

•watson-developer-cloud

•wit

一些軟件包(如 wit 和 apiai )提供了一些超出基本語音識別的內置功能,如識別講話者意圖的自然語言處理功能。其他軟件包,如谷歌雲語音,則專注於語音向文本的轉換。

其中,SpeechRecognition 就因便於使用脫穎而出。

 

識別語音需要輸入音頻,而在 SpeechRecognition 中檢索音頻輸入是非常簡單的,它無需構建訪問麥克風和從頭開始處理音頻文件的腳本,只需幾分鍾即可自動完成檢索並運行。

 

 SpeechRecognition 庫可滿足幾種主流語音 API ,因此靈活性極高。其中 Google Web Speech API 支持硬編碼到 SpeechRecognition 庫中的默認 API 密鑰,無需注冊就可使用。SpeechRecognition 以其靈活性和易用性成為編寫 Python 程序的最佳選擇。

 

pip install SpeechRecognition

  安裝完成后請打開解釋器窗口並輸入以下內容來驗證安裝:

import speech_recognition as sr
>>> sr.__version__
'3.8.1'

  

注:不要關閉此會話,在后幾個步驟中你將要使用它。

若處理現有的音頻文件,只需直接調用 SpeechRecognition ,注意具體的用例的一些依賴關系。同時注意,安裝 PyAudio 包來獲取麥克風輸入。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM