轉【面向代碼】學習 Deep Learning（二）Deep Belief Nets(DBNs)

本文轉載自查看原文 2013-08-11 11:31 6931

分類：機器學習2013-07-24 11:50 517人閱讀評論(5) 收藏舉報

==========================================================================================

最近一直在看Deep Learning，各類博客、論文看得不少

但是說實話，這樣做有些疏於實現，一來呢自己的電腦也不是很好，二來呢我目前也沒能力自己去寫一個toolbox

只是跟着Andrew Ng的UFLDL tutorial 寫了些已有框架的代碼(這部分的代碼見github)

后來發現了一個matlab的Deep Learning的toolbox，發現其代碼很簡單，感覺比較適合用來學習算法

再一個就是matlab的實現可以省略掉很多數據結構的代碼，使算法思路非常清晰

所以我想在解讀這個toolbox的代碼的同時來鞏固自己學到的，同時也為下一步的實踐打好基礎

(本文只是從代碼的角度解讀算法，具體的算法理論步驟還是需要去看paper的

我會在文中給出一些相關的paper的名字，本文旨在梳理一下算法過程，不會深究算法原理和公式)

==========================================================================================

使用的代碼：DeepLearnToolbox ，下載地址：點擊打開，感謝該toolbox的作者

==========================================================================================

今天介紹DBN的內容，其中關鍵部分都是(Restricted Boltzmann Machines, RBM)的步驟，所以先放一張rbm的結構，幫助理解

(圖來自baidu的一個講解ppt)

==========================================================================================

照例，我們首先來看一個完整的DBN的例子程序：

這是\tests\test_example_DBN.m 中的ex2

[cpp] view plain copy

其中的過程簡單清晰明了，就是dbnsetup(),dbntrain()以及dbnunfoldtonn()三個函數

最后fine tuning的時候用了（一）里看過的nntrain和nntest，參見（一）

這個實在沒什么好說的，

直接分層初始化每一層的rbm(受限波爾茲曼機(Restricted Boltzmann Machines, RBM))
同樣，W,b,c是參數，vW,vb,vc是更新時用到的與momentum的變量，見到代碼時再說

[cpp] view plain copy

應為DBN基本就是把rbm當做磚塊搭建起來的，所以train也很簡單

[cpp] view plain copy

首先映入眼簾的是對第一層進行rbmtrain()，后面每一層在train之前用了rbmup，

rbmup其實就是簡單的一句sigm(repmat(rbm.c', size(x, 1), 1) + x * rbm.W');

也就是上面那張圖從v到h計算一次，公式是Wx+c

接下來是最關鍵的rbmtrain了：

代碼如下，說明都在注釋里

論文參考：【1】Learning Deep Architectures for AI 以及

【2】A Practical Guide to Training Restricted Boltzmann Machines

你可以和【1】里面的這段偽代碼對應一下

[cpp] view plain copy

for i = 1 : opts.numepochs //迭代次數
kk = randperm(m);
err = 0;
for l = 1 : numbatches
batch = x(kk((l - 1) * opts.batchsize + 1 : l * opts.batchsize), :);
v1 = batch;
h1 = sigmrnd(repmat(rbm.c', opts.batchsize, 1) + v1 * rbm.W'); //gibbs sampling的過程
v2 = sigmrnd(repmat(rbm.b', opts.batchsize, 1) + h1 * rbm.W);
h2 = sigmrnd(repmat(rbm.c', opts.batchsize, 1) + v2 * rbm.W');
//Contrastive Divergence 的過程
//這和《Learning Deep Architectures for AI》里面寫cd-1的那段pseudo code是一樣的
c1 = h1' * v1;
c2 = h2' * v2;
//關於momentum，請參看Hinton的《A Practical Guide to Training Restricted Boltzmann Machines》
//它的作用是記錄下以前的更新方向，並與現在的方向結合下，跟有可能加快學習的速度
rbm.vW = rbm.momentum * rbm.vW + rbm.alpha * (c1 - c2) / opts.batchsize;
rbm.vb = rbm.momentum * rbm.vb + rbm.alpha * sum(v1 - v2)' / opts.batchsize;
rbm.vc = rbm.momentum * rbm.vc + rbm.alpha * sum(h1 - h2)' / opts.batchsize;
//更新值
rbm.W = rbm.W + rbm.vW;
rbm.b = rbm.b + rbm.vb;
rbm.c = rbm.c + rbm.vc;
err = err + sum(sum((v1 - v2) .^ 2)) / opts.batchsize;
end
end