人工智能-baidu-aip語音識別(語音轉文字)


做這個之前,需要在電腦上安裝FFmpeg工具,將要轉的語音格式轉為PCM格式.
FFmpeg不需要安裝,下載后,打開bin文件夾,然后將路徑放在系統環境變量里.
記住,要關閉所有打開的Pycharm,然后重啟,FFmpeg的環境變量才生效.

1.打開bin文件

 

2.復制文件所在路徑

D:\ffmpe-win64-shared\ffmpeg-20180619-a990184-win64-shared\bin

 

3.添加系統環境變量

 

下面是代碼部分:

# Python
import os
# Third-party Library
from aip import AipSpeech

APP_ID = '15422825'
APP_KEY = 'DhXGtWHYMujMVZZGRI3a7rzb'
SECRET_KEY = 'PbyUvTL31fImGthOOIP5ZbbtEOGwGOoT'
# 與百度進行一次加密校驗,認證你是合法用戶合法的應用
# AipSpeech是百度語音的客戶端,認證成功之后,客戶端將被開啟,這里的client就是已經開啟的百度語音的客戶端了
client = AipSpeech(APP_ID, APP_KEY, SECRET_KEY)

# 1.將wma格式文件轉為pcm格式文件
def get_file_content(filePath):
    # 執行cmd命令os.system()
    os.system(f"ffmpeg -y  -i {filePath} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm")
    with open(f"{filePath}.pcm", 'rb') as fp:
        return fp.read()

# 2.將音頻轉成文字
res = client.asr(get_file_content('media/weather.wma'), 'pcm', 16000, {
    # 不填寫lan參數生效,都不填寫,默認1537(普通話 輸入法模型),dev_pid參數見本節開頭的表格
    'dev_pid': 1536,
})
# 將錄音轉成文字,然后打印
print(res.get("result")[0])

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM