Pytorch中的自動求梯度機制和Variable類

本文轉載自查看原文 2019-09-23 20:42 965 pytorch

　　自動求導機制是每一個深度學習框架中重要的性質，免去了手動計算導數，下面用代碼介紹並舉例說明Pytorch的自動求導機制。

　　首先介紹Variable，Variable是對Tensor的一個封裝，操作和Tensor是一樣的，但是每個Variable都有三個屬性：Varibale的Tensor本身的.data，對應Tensor的梯度.grad，以及這個Variable是通過什么方式得到的.grad_fn，根據最新消息，在pytorch0.4更新后，torch和torch.autograd.Variable現在是同一類。torch.Tensor能像Variable那樣追蹤歷史和反向傳播。Variable仍能正確工作，但是返回的是Tensor。

　　我們擁抱這些新特性，看看Pytorch怎么進行自動求梯度。

1 #encoding:utf-8
2 import torch
3 
4 x = torch.tensor([2.],requires_grad=True) #新建一個tensor,允許自動求梯度,這一項默認是false.
5 y = (x+2)**2 + 3 #y的表達式中包含x,因此y能進行自動求梯度
6 y.backward()
7 print(x.grad)

　　輸出結果是：

tensor([8.])

　　這里添加一個小知識點，即torch.Tensor和torch.tensor的不同。二者均可以生成新的張量，但torch.Tensor()是python類，是默認張量類型torch.FloatTensor()的別名，使用torch.Tensor()會調用構造函數，生成單精度浮點類型的張量。

　　而torch.tensor()是函數，其中data可以是list,tuple,numpy,ndarray,scalar和其他類型，但只有浮點類型的張量能夠自動求梯度。

torch.tensor(data, dtype=None, device=None, requires_grad=False)

　　言歸正傳，上一個例子的變量本質上是標量。下面一個例子對矩陣求導。

 1 #encoding:utf-8
 2 import torch
 3 
 4 x = torch.ones((2,4),requires_grad=True)
 5 y = torch.ones((2,1),requires_grad=True)
 6 W = torch.ones((4,1),requires_grad=True)
 7 
 8 J = torch.sum(y - torch.matmul(x,W)) #torch.matmul()表示對矩陣作乘法
 9 J.backward()
10 print(x.grad)
11 print(y.grad)
12 print(W.grad)

　　輸出結果是：

tensor([[-1., -1., -1., -1.],
        [-1., -1., -1., -1.]])
tensor([[1.],
        [1.]])
tensor([[-2.],
        [-2.],
        [-2.],
        [-2.]])

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pytorch 自動求梯度 Pytorch之Variable求導機制 pytorch 中的variable函數【PyTorch】PyTorch中的梯度累加 Pytorch學習（一）—— 自動求導機制 pytorch常規操作-張量擴增、維度擴展、梯度取反、求梯度、CNN與LSTM輸入輸出維度含義等等 PyTorch學習之自動求導機制-Volatile標志 pytorch的自動求導機制 - 計算圖的建立矩陣求梯度莫煩pytorch學習筆記(二)——variable