pytorch 不同學習率設置方法

本文轉載自查看原文 2018-11-13 16:00 6098 Pytorch/ pytorch 不同學習率設置方法

最近注意到在一些caffe模型中，偏置項的學習率通常設置為普通層的兩倍。具體原因可以參考(https://datascience.stackexchange.com/questions/23549/why-is-the-learning-rate-for-the-bias-usually-twice-as-large-as-the-the-lr-for-t)，貌似沒有文章提到這個。
Pytorch中也提供了對不同層設置不同學習率以及衰減因子的方法。
主要方法是傳遞一個dict給optimizer，而不是list。

下面以restnet18進行說明：
首先加載resnet18 模型，並打印其參數設置：

import torch, torchvision
model = torchvision.models.resnet18()
paras = dict(model.named_parameters())

for k, v in paras.items():
    print(k.ljust(30), str(v.shape).ljust(30), 'bias:', v.requires_grad)

輸出為：

設置優化器參數，並打印

paras_new = []
for k, v in paras.items():
     if 'bias' in k:
        paras_new += [{'params': [v], 'lr': 0.02, 'weight_decay': 0}]
     else:
        paras_new += [{'params': [v], 'lr': 0.01, 'weight_decay': 0.00004}]
optimizer = torch.optim.SGD(paras_new, momentum=0.9)

for p in optimizer.param_groups:
     outputs = ''
     for k, v in p.items():
         if k is 'params':
             outputs += (k + ': ' + str(v[0].shape).ljust(30) + ' ')
         else:
             outputs += (k + ': ' + str(v).ljust(10) + ' ')
     print(outputs)

結果為:

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Pytorch:學習率調整 PyTorch學習之六個學習率調整策略如何設置學習率 Tensorflow 之finetune微調模型方法&&不同層上設置不同的學習率 Pytorch使用ReduceLROnPlateau來更新學習率 Pytorch中的學習率衰減及其用法【學習筆記】Pytorch深度學習—學習率調整策略 Pytorch框架學習---（5）調整學習率、可視化操作 pytorch設置多GPU運行的方法 pytorch中調整學習率的lr_scheduler機制