根據 caffe/src/caffe/proto/caffe.proto 里面的文件,可以看到它有以下幾種學習率的衰減速機制:
1. fixed: 在訓練過程中,學習率不變;
2. step: 它的公式可以表示:
, 所以呢,它的學習率的變化就像台價一樣;step by step 的; 其中的 gamma 與 stepsize需要設置的;
3.exp : 表示指數型的;公式為:
;其中參數 gamma 需要設置;
4. inv : 它表示什么意思不知道啊; 公式為:
,其中參數 gamma 與 power 都需要設置;
5.multistep: 它可以設置多個 stepvalue的值, 在prototxt里面也沒有具體介紹, 它由參數 stepsize 與 stepvalue 決定; 它不是每時第刻都去計算 學習率,而是達到我們設定的stepvalue的時候,才去計算(根據方法2中的公式),然后更新學習率; stepvalue 可以設置多個的,下面是 stepvalue的定義;
183 repeated int32 stepvalue = 34;
6、 poly : 多項式衰減: 它的公式為:
,當到達最大次數時, 學習率變為了0;

![clip_image002[13] clip_image002[13]](/image/aHR0cHM6Ly9pbWFnZXMyMDE3LmNuYmxvZ3MuY29tL2Jsb2cvOTYxNzU0LzIwMTcwOC85NjE3NTQtMjAxNzA4MDcwOTQxMjg2NzQtMjAwMjk2NzU3NS5wbmc=.png)