作者:桂。
時間:2017-05-10 19:17:32
鏈接:http://www.cnblogs.com/xingshansi/p/6832219.html
一、環境
- python3.5
- Win8.1,64位
二、Wavenet安裝
Wavenet安裝環境:
- Tensorflow:1.0.1以上版本,查看自己的版本:
- librosa工具包:用來讀寫audio文件,之前已經安裝;
有了上面的條件,
- 在Github上下載Wavenet工具包,關於Wavenet工具包,也有學者提出了Fast wavenet
- 用於Wavenet訓練的語料庫CSTR VCTK Corpus
將tensorflow-wavenet文件夾放在:\Anaconda3\Lib\文件夾下,cd到對應路徑並運行:
pip install -r requirements.txt
安裝tensorflow-wavenet完畢:
下載VCTK數據庫,並解壓:
python切換到指定路徑下,輸入:
python train.py --help
可以查看函數具體用法:
VCTK/wav48/中不同文件夾的音頻信息:
將VCTK/wav48/的部分音頻復制,形成一個用於訓練的wav文件夾:
並修改train.py對應指令:
運行train.py報錯:
stackoverflow給出了解答:
按照這個說法,新建logdir:
並修改train.py的代碼:
訓練過程中有許多warning的提示,意思是音頻基本都是寂靜音,因此進行忽略:
原程序中:SILENCE_THRESHOLD = 0.3,這里參考stackoverflow的說法:
將SILENCE_THRESHOLD設定為0.1,可以看到雖然還有部分是warninig,但已經可以training了:
同樣,generate.py的路徑也修改一下:
generate.py的結果有點像噪聲,可能操作有問題,記錄在此:
打算后面學習Wavenet,Wavenet的更多內容參考Github.
涉及到的概念較多,后面打算學習一些Tensorflow的知識並系統學習深度神經網絡的相關知識。