optimizer.state_dict()、optimizer.param_groups

本文转载自查看原文 2020-08-03 20:12 1225 pytorch函数

net = t.nn.Linear(2, 3)
optimizer = t.optim.SGD(net.parameters(), lr=0.2)
for key, value in optimizer.state_dict().items():
    print(key, value)
for i, param_group in enumerate(optimizer.param_groups):
    print(i+1)
    print(param_group)

1、optimizer.state_dict()

"""

state {}
param_groups [{'lr': 0.2, 'momentum': 0, 'dampening': 0, 'weight_decay': 0, 'nesterov': False, 'params': [140327302981024, 140327686399752]}]

"""

是一个字典，包括优化器的状态（state）以及一些超参数信息（param_groups）

2、optimizer.param_groups

"""

1
{'params': [Parameter containing:
tensor([[-0.2604, 0.0777],
[-0.6420, 0.5030],
[-0.3879, -0.5129]], requires_grad=True), Parameter containing:
tensor([ 0.6245, 0.4680, -0.3667], requires_grad=True)], 'lr': 0.2, 'momentum': 0, 'dampening': 0, 'weight_decay': 0, 'nesterov': False}

"""

是param_groups是一个数组，数组内部包含n个字典

总结：state_dict()包括param_groups

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 PyTorch的动态学习率和optimizer.param_groups[0] 优化器Optimizer pytorch optimizer小记 Piecewise Jerk Path Optimizer A Modified Particle Swarm Optimizer scipy优化器optimizer 各种优化器Optimizer的总结与比较 mysql 参数optimizer_switch keras中的loss、optimizer、metrics optimizer.zero_grad()的作用