使用百度雲API進行語音轉文字(基於python的wav文件轉換)


  1. 登錄http://ai.baidu.com/,控制台->人工智能->語音技術,創建一個應用
  2. 根據其Python SDK文檔 進行Demo測試
    • 安裝依賴包:pip install baidu-aip
    • wav文件轉換成文字Demo:
    • 注意:1、存儲的wav文件采樣率為16000 2、wav文件為單聲道,否則會影響語音識別的准確性
    •  1 #!/usr/bin/python
       2 # -*- coding: UTF-8 -*-
       3 from aip import AipSpeech
       4 
       5 #從百度AI開放平台創建應用處獲取
       6 APP_ID = ''
       7 API_KEY = ''
       8 SECRET_KEY = ''
       9 
      10 client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
      11 
      12 # 讀取文件
      13 def get_file_content(filePath):
      14     with open(filePath, 'rb') as fp:
      15         return fp.read()
      16 
      17 # 識別本地文件
      18 def get_text():
      19     result = client.asr(get_file_content('record.wav'), 'wav', 16000, {
      20     'dev_pid': 1536,})
      21     print(result)
      22     text = result['result'][0]
      23     return text
      24 
      25 print(get_text())  

       


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM