作者:桂。
時間:2017-05-10 19:17:32
鏈接:http://www.cnblogs.com/xingshansi/p/6832219.html

一、環境
- python3.5
 - Win8.1,64位
 
二、Wavenet安裝
Wavenet安裝環境:
- Tensorflow:1.0.1以上版本,查看自己的版本:
 

- librosa工具包:用來讀寫audio文件,之前已經安裝;
 
有了上面的條件,
- 在Github上下載Wavenet工具包,關於Wavenet工具包,也有學者提出了Fast wavenet
 - 用於Wavenet訓練的語料庫CSTR VCTK Corpus
 
將tensorflow-wavenet文件夾放在:\Anaconda3\Lib\文件夾下,cd到對應路徑並運行:
pip install -r requirements.txt
安裝tensorflow-wavenet完畢:

下載VCTK數據庫,並解壓:

python切換到指定路徑下,輸入:
python train.py --help
可以查看函數具體用法:

VCTK/wav48/中不同文件夾的音頻信息:

將VCTK/wav48/的部分音頻復制,形成一個用於訓練的wav文件夾:

並修改train.py對應指令:

運行train.py報錯:

stackoverflow給出了解答:

按照這個說法,新建logdir:

並修改train.py的代碼:
 
訓練過程中有許多warning的提示,意思是音頻基本都是寂靜音,因此進行忽略:

原程序中:SILENCE_THRESHOLD = 0.3,這里參考stackoverflow的說法:

將SILENCE_THRESHOLD設定為0.1,可以看到雖然還有部分是warninig,但已經可以training了:

同樣,generate.py的路徑也修改一下:

generate.py的結果有點像噪聲,可能操作有問題,記錄在此:

打算后面學習Wavenet,Wavenet的更多內容參考Github.
涉及到的概念較多,后面打算學習一些Tensorflow的知識並系統學習深度神經網絡的相關知識。
