人工智能-baidu-aip語音識別(語音轉文字)

本文轉載自查看原文 2019-01-15 19:14 851 人工智能

做這個之前,需要在電腦上安裝FFmpeg工具,將要轉的語音格式轉為PCM格式.
FFmpeg不需要安裝,下載后,打開bin文件夾，然后將路徑放在系統環境變量里.
記住,要關閉所有打開的Pycharm,然后重啟,FFmpeg的環境變量才生效.

1.打開bin文件

2.復制文件所在路徑

D:\ffmpe-win64-shared\ffmpeg-20180619-a990184-win64-shared\bin

3.添加系統環境變量

下面是代碼部分：

# Python
import os
# Third-party Library
from aip import AipSpeech

APP_ID = '15422825'
APP_KEY = 'DhXGtWHYMujMVZZGRI3a7rzb'
SECRET_KEY = 'PbyUvTL31fImGthOOIP5ZbbtEOGwGOoT'
# 與百度進行一次加密校驗,認證你是合法用戶合法的應用
# AipSpeech是百度語音的客戶端,認證成功之后,客戶端將被開啟,這里的client就是已經開啟的百度語音的客戶端了
client = AipSpeech(APP_ID, APP_KEY, SECRET_KEY)

# 1.將wma格式文件轉為pcm格式文件
def get_file_content(filePath):
    # 執行cmd命令os.system()
    os.system(f"ffmpeg -y  -i {filePath} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm")
    with open(f"{filePath}.pcm", 'rb') as fp:
        return fp.read()

# 2.將音頻轉成文字
res = client.asr(get_file_content('media/weather.wma'), 'pcm', 16000, {
    # 不填寫lan參數生效,都不填寫,默認1537(普通話 輸入法模型),dev_pid參數見本節開頭的表格
    'dev_pid': 1536,
})
# 將錄音轉成文字,然后打印
print(res.get("result")[0])

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 人工智能語音識別系統開發人工智能 - 基於火狐瀏覽器的語音識別,語音自動回復人工智能API調用 - 實現語音合成,語音識別,語音聊天機器人 C# 語音識別（文字to語音、語音to文字）人工智能視覺行為識別 Python圖片識別——人工智能篇 java語音轉文字 python實現人工智能語音助手 .NET 語音轉文字文字轉語音人工智能分類