(一)准備訓練語音文件


1、安裝音頻錄放工具“sox”:

"sox"主要包含兩個命令,后續將會用到:rec(錄音)和play(播放)。

sudo apt-get install sox

 

2、創建目錄樹:

為了有序組織各種中間文件,在創建如圖所示目錄樹:

mkdir -p htk_color/{config,data/{test/{mfc,speech},train/{mfc,speech}},dict,hmm0,hmm1,hmm2,hmm3,hmm4,hmm5,hmm6,hmm7,labels,lists,results,scripts}



 

3、錄制“訓練語音文件”:

cd htk_color;(注:之后的所有命令都在此目錄下執行

錄制音頻文件01.wav~50.wave,並置於data/train/speech/目錄中(按CTRL-C結束錄音),

rec -b 8 data/train/speech/01.wav

rec -b 8 data/train/speech/02.wav

……

rec -b 8 data/train/speech/50.wav

錄音的內容為:“RED"或"YELLOW"或"BLUE",總共要50個,以下給了個清單,以供參考(請按順序錄制):

(請將此清單保存至"labels"目錄下,並且命名為"trainprompts")

BLUE
RED
BLUE
BLUE
BLUE
YELLOW
RED
BLUE
BLUE
RED
YELLOW
YELLOW
BLUE
BLUE
RED
BLUE
BLUE
YELLOW
YELLOW
BLUE
RED
BLUE
BLUE
BLUE
RED
BLUE
YELLOW
BLUE
BLUE
BLUE
YELLOW
RED
YELLOW
YELLOW
YELLOW
BLUE
BLUE
RED
RED
RED
RED
BLUE
YELLOW
RED
BLUE
BLUE
BLUE
BLUE
BLUE
YELLOW

 

 

4、錄音試聽(可選):

試聽一下有沒有一走神錄錯了的:

play data/train/speech/01.wav

play data/train/speech/02.wav

……

 

在一個陽光明媚的下午,因為害怕打擾到室友睡覺,我躲在月黑風高的廁所,帶着滿滿的廁所味,英勇的錄制了這50個訓練音頻

以供參考(建議自行錄制,以便測試時達到最好效果,畢竟最后識別的是你的聲音,除非你的聲音和我一樣有“魅力”):

 

HTK Book涉及內容:

Chapter 3: 3.1.3 Step 3 - Recording the Data


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM