單。閱讀本指南,你就將會了解。你將學到:
•語音識別的工作原理;
•PyPI 支持哪些軟件包;
•如何安裝和使用 SpeechRecognition 軟件包——一個功能全面且易於使用的 Python 語音識別庫。
選擇 Python 語音識別包
PyPI中有一些現成的語音識別軟件包。其中包括:
•apiai
•google-cloud-speech
•pocketsphinx
•SpeechRcognition
•watson-developer-cloud
•wit
一些軟件包(如 wit 和 apiai )提供了一些超出基本語音識別的內置功能,如識別講話者意圖的自然語言處理功能。其他軟件包,如谷歌雲語音,則專注於語音向文本的轉換。
其中,SpeechRecognition 就因便於使用脫穎而出。
識別語音需要輸入音頻,而在 SpeechRecognition 中檢索音頻輸入是非常簡單的,它無需構建訪問麥克風和從頭開始處理音頻文件的腳本,只需幾分鍾即可自動完成檢索並運行。
SpeechRecognition 庫可滿足幾種主流語音 API ,因此靈活性極高。其中 Google Web Speech API 支持硬編碼到 SpeechRecognition 庫中的默認 API 密鑰,無需注冊就可使用。SpeechRecognition 以其靈活性和易用性成為編寫 Python 程序的最佳選擇。
pip install SpeechRecognition
安裝完成后請打開解釋器窗口並輸入以下內容來驗證安裝:
import speech_recognition as sr >>> sr.__version__ '3.8.1'
注:不要關閉此會話,在后幾個步驟中你將要使用它。
若處理現有的音頻文件,只需直接調用 SpeechRecognition ,注意具體的用例的一些依賴關系。同時注意,安裝 PyAudio 包來獲取麥克風輸入。