做這個之前,需要在電腦上安裝FFmpeg工具,將要轉的語音格式轉為PCM格式.
FFmpeg不需要安裝,下載后,打開bin文件夾,然后將路徑放在系統環境變量里.
記住,要關閉所有打開的Pycharm,然后重啟,FFmpeg的環境變量才生效.
1.打開bin文件
2.復制文件所在路徑
D:\ffmpe-win64-shared\ffmpeg-20180619-a990184-win64-shared\bin
3.添加系統環境變量
下面是代碼部分:
# Python import os # Third-party Library from aip import AipSpeech APP_ID = '15422825' APP_KEY = 'DhXGtWHYMujMVZZGRI3a7rzb' SECRET_KEY = 'PbyUvTL31fImGthOOIP5ZbbtEOGwGOoT' # 與百度進行一次加密校驗,認證你是合法用戶合法的應用 # AipSpeech是百度語音的客戶端,認證成功之后,客戶端將被開啟,這里的client就是已經開啟的百度語音的客戶端了 client = AipSpeech(APP_ID, APP_KEY, SECRET_KEY) # 1.將wma格式文件轉為pcm格式文件 def get_file_content(filePath): # 執行cmd命令os.system() os.system(f"ffmpeg -y -i {filePath} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm") with open(f"{filePath}.pcm", 'rb') as fp: return fp.read() # 2.將音頻轉成文字 res = client.asr(get_file_content('media/weather.wma'), 'pcm', 16000, { # 不填寫lan參數生效,都不填寫,默認1537(普通話 輸入法模型),dev_pid參數見本節開頭的表格 'dev_pid': 1536, }) # 將錄音轉成文字,然后打印 print(res.get("result")[0])