Dropout：隨機失活

本文轉載自查看原文 2020-02-05 22:11 212 計算機視覺：cs231n

1. Dropout：是指在深度學習網絡的訓練過程中，對於神經網絡單元，按照一定的概率將其暫時從網絡中丟棄（使其暫時不工作），使一部分神經元工作，使另一部分神經元不工作；沒有被刪除的部分的參數得到更新，被刪除的神經元參數保持之前的狀態，此次訓練過程中暫時不參加神經網絡的計算，不更新權值，以達到避免過擬合，增加模型泛化的目的

△實質：讓每個神經元的激活函數的輸出值（激活函數值）以p的概率保持原樣，以1-p的概率等於0

①在訓練階段，每個神經單元以概率p被保留，以1-p的概率被丟棄

②在測試階段，每個神經單元都是存在的，激活函數輸出值要乘以p，即[ f（W*x+b）]*p （有的博客說是權值矩陣W*p 不知道這兩者有什么聯系？）

一般p=0.5，使其激活函數值=0：

每次都是隨機失活：

訓練階段以p的概率被保留；測試階段（W*x + b）*p：

2. Dropout的運行：（訓練階段）一般p=0.5

①首先隨機（臨時）刪掉網絡中一半的隱藏神經元，輸入輸出神經元保持不變

②將輸入x通過修改后的網絡進行前向傳播，然后把得到的損失結果通過修改的網絡反向傳播；1個batch執行完這個過程后，在沒有被刪除的神經元上按照SGD更新對應的參數W、b

③然后繼續重復這一過程，直到訓練結束：

（1）恢復被刪掉的神經元 -- 被刪除的神經元保持原樣，而沒有被刪除的神經元已經有所更新
（2）從隱藏層神經元中隨機選擇一個一半大小的子集臨時刪除掉，備份被刪除神經元的參數
（3）對1個batch，先前向傳播然后反向傳播損失並根據隨機梯度下降法更新參數（w，b）- 沒有被刪除的那一部分參數得到更新，刪除的神經元參數保持之前的狀態

虛線為部分臨時被刪除的神經元：