pytorch中的detach和detach_

本文轉載自查看原文 2018-11-19 10:20 14542 PyTorch

pytorch 的 Variable 對象中有兩個方法，detach和 detach_ :

detach

官方文檔中，對這個方法是這么介紹的。

返回一個新的從當前圖中分離的 Variable。
返回的 Variable 永遠不會需要梯度
如果被 detach 的Variable volatile=True，那么 detach 出來的 volatile 也為 True
還有一個注意事項，即：返回的 Variable 和被 detach 的Variable 指向同一個 tensor

 1 import torch  2 from torch.nn import init  3 from torch.autograd import Variable  4 t1 = torch.FloatTensor([1., 2.])  5 v1 = Variable(t1)  6 t2 = torch.FloatTensor([2., 3.])  7 v2 = Variable(t2)  8 v3 = v1 + v2  9 v3_detached = v3.detach() 10 v3_detached.data.add_(t1) # 修改了 v3_detached Variable中 tensor 的值
11 print(v3, v3_detached)    # v3 中tensor 的值也會改變

detach的源碼：

1 # detach 的源碼
2 def detach(self): 3     result = NoGrad()(self)  # this is needed, because it merges version counters
4     result._grad_fn = None 5     return result

detach_

官網給的解釋是：將 Variable 從創建它的 graph 中分離，把它作為葉子節點。

從源碼中也可以看出這一點

將 Variable 的grad_fn 設置為 None，這樣，BP 的時候，到這個 Variable 就找不到它的 grad_fn，所以就不會再往后BP了。
將 requires_grad 設置為 False。這個感覺大可不必，但是既然源碼中這么寫了，如果有需要梯度的話可以再手動將 requires_grad 設置為 true

1 # detach_ 的源碼
2 def detach_(self): 3     """Detaches the Variable from the graph that created it, making it a 4  leaf. 5     """
6     self._grad_fn = None 7     self.requires_grad = False

能用來干啥

可以對部分網絡求梯度。

如果我們有兩個網絡 , 兩個關系是這樣的現在我們想用來為B網絡的參數來求梯度，但是又不想求A網絡參數的梯度。我們可以這樣：

# y=A(x), z=B(y) 求B中參數的梯度，不求A中參數的梯度
# 第一種方法
y = A(x)
z = B(y.detach())
z.backward()
 
# 第二種方法
y = A(x)
y.detach_()
z = B(y)
z.backward()

在這種情況下，detach 和 detach_ 都可以用。但是如果你也想用 $y$

$y$

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pytorch .detach() .detach_() 和 .data用於切斷反向傳播 pytorch中copy() clone() detach() Pytorch中 detach() item() cpu() numpy()互相轉換 pytorch detach函數 pytorch訓練GAN時的detach() 多線程中的detach jquery 中remove()與detach()的區別 torch中clone()與detach()操作 Linux中pthread_detach()線程注意 tensor中的data()函數與detach()的區別