訓練模型,是換臉過程中最重要的一部分,也是耗時最長的一部分。很多人會問到底需要多少時間?有人會告訴你看loss值到0.02以下就可以了。我會告訴你,不要看什么數值,看預覽窗口的人臉。看第二列是否和第一列一樣清晰,看最后一列是否清晰,如果答案是“是”,那么恭喜你可以進入下一個環節了。
這個環節主要包括6個文件,每個文件代表一種模型,你只需選擇一種即可。目前用的比較多的是,H64,H128,SAE 。
如果你玩這個軟件,建議選着H64,出效果快,參數簡單。
如果你需要更高的清晰度可選H128
如果你需要自定義更多參數選SAE。
6) train H64.bat
這個步驟雖然是最重要的,但是操作其實非常簡單,比如你使用H64模型。只需雙擊文件。
雙擊文件文件之后一路回車,當跳出帶頭像的預覽窗口就代表已經開始訓練。剛開始訓練的時候,第二列和第四列是空的,什么都沒有,隨着時間的推移會出現模糊的頭像,繼續訓練頭像會越來越清晰。
6) train H128.bat
這是H128,點擊后出現的預覽圖明顯比H64要大很多,這也是他們唯一的區別。
6) train SAE.bat
這是SAE的效果圖。默認SAE的頭像是128×128,等同於H128。 但是SAE的參數會更多。
下面說說模型訓練環節常見的幾個概念
Batch_size
這是一個深度學習中最常見的數字,也是每個模型必備參數。這個值到底取多少沒有標准,默認為4,你可以用的值為2的n次方,比如2,4,8,16,32,64,128。一個普遍的常識是,數字大的會比小的效果好,loss收斂更快,震盪區域更小,但是對於機器配置的要求也越高。主要是對顯存需求變大,一般4G顯存最高只能16,繼續提高會報OOM錯誤。
Epoch
這又是一個深度學習概念,講的是訓練完所有素材消耗的時間,最新版本這個名詞改成了iteration 。 這么一改可能會讓人有點混亂,但是你無需過多關注。你可以簡單的認為是訓練的次數。這個數值越大訓練次數越多,效果越好。 而[1046ms] 這個數字越低,代表你電腦的配置越好,訓練模型需要的時間更短。
LOSS
這TM又是一個深度學習的概念,反正就是越低越好。但是不要看絕對值,要看趨勢,這個值慢慢降低,對應的預覽圖會越來越清晰,當降到一定數值(不一定是0.02或者0.01)后就很難在降低。
History
在開始訓練的時候Write preview history 輸入Y之后,workspace\model\h64_history下面就會保存各個階段的預覽圖。這個圖很直觀的展現了你這個模型的進化過程。
對於train這個訓練環節,你只要看最直觀的預覽圖即可,其他都是浮雲,浮雲,浮雲。
訓練結束之后!!!
我們就可以進入真正的換臉環節了:臉部替換以及合成視頻!
AI換臉系列文章:
- DeepFaceLab軟件簡介
- DeepFaceLab軟件安裝
- DeepFaceLab軟件使用
- DeepFaceLab人臉提取詳解
- DeepFaceLab模型訓練詳解
- DeepFaceLab導出視頻詳解
更多內容請參考:DeepFakes中文網
公眾號:托尼是塔克