weight_decay in Pytorch


在訓練人臉屬性網絡時,發現在優化器里增加weight_decay=1e-4反而使准確率下降

pytorch論壇里說是因為pytorch對BN層的系數也進行了weight_decay,導致BN層的系數趨近於0,使得BN的結果毫無意義甚至錯誤

當然也有辦法不對BN層進行weight_decay,

詳見pytorch forums討論1
pytorch forums討論2


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM