Mockingbird_訓練自己的synthesizer模型


一.github作者指南
1.下載數據集並解壓:確保您可以訪問 train 文件夾中的所有音頻文件(如.wav)
2.進行音頻和梅爾頻譜圖預處理: python pre.py <datasets_root> -d {dataset} -n {number}
可傳入參數:
-d {dataset} 指定數據集,支持 aidatatang_200zh, magicdata, aishell3, data_aishell, 不傳默認為aidatatang_200zh
-n {number} 指定並行數,CPU 11770k + 32GB實測10沒有問題
3.假如你下載的 aidatatang_200zh文件放在D盤,train文件路徑為 D:\data\aidatatang_200zh\corpus\train , 你的datasets_root就是 D:\data
4.訓練合成器: python synthesizer_train.py mandarin <datasets_root>/SV2TTS/synthesizer

二.實際操作命令行
1.預處理:python pre.py F:\機器學習\實踐\AI語音克隆\data
2.指定顯卡進行模型訓練:CUDA_VISIBLE_DEVICES=0,1,2,3 python synthesizer_train.py mandarin F:\機器學習\實踐\AI語音克隆\data/SV2TTS/synthesizer
3.數據集混合訓練
按這個順序運行pre:
1.第一次直接運行pre.py,默認處理aidatatang
2. 第二次指定數據集為aishell3, 帶上-d aishell3 -s
3. 第三次指定數據集為data_aishell,帶上-d data_aishell -s


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM