回聲狀態網絡ESN(Echo State Networks)


1.1 網絡結構

ESN通過隨機地部署大規模系數鏈接的神經元構成網絡隱層,一般稱為"儲備池"。ESN網絡具有的特點如下:

 (1)包含數目相對較多的神經元;

 (2)神經元之間的連接關系隨機產生;

 (3)神經元之間的鏈接具有稀疏性;

 網絡結構:

 

可以看出網絡主要三層結構構成:

1.輸入層(Input Layer)

輸入向量u(n)其維度為:n×1

輸入層→存儲池的連接權重為:

注意該權重是不需要訓練的,隨機初始化完成即可

2.儲存池(Reservoir)

存儲池接受兩個方向的輸入一個來自於輸入層u(n),另外一個來自存儲池前一個狀態的輸出x(n−1),

其中狀態反饋權重​相同均不需要訓練,由隨機初始狀態決定,所以為大型稀疏矩陣,其中的非0元素表明了存儲池中被激活的神經元:

 3.輸出層(Readout)

存儲池→輸出層為線性連接關系,即滿足:

 

實際訓練過程中需要訓練線性連接的權重。

核心思想:使用大規模隨機稀疏網絡(存儲池)作為信息處理媒介,將輸入信號從低維輸入空間映射到高維度狀態空間,在高維狀態空間采用線性回歸方法對網絡的部分連接權重進行訓練,而其他隨機連接的權重在網絡訓練過程中保持不變。

1.2 ESN關鍵參數

1.3 ESN算法過程

1.權重參數初始化

 輸出層權重初始化

 存儲池內部反饋權重初始化

 

2.訓練階段

 

上述介紹的是訓練算法分為離線訓練和在線訓練兩種情況,一般情況下,由於矩陣X可能為奇異矩陣,

所以X的逆矩陣采用偽逆算法或者正則化技術:嶺回歸(Ridge Regression)算法。

1.3 ESN超參數

整個網絡只需要訓練WoutWout,所以它的訓練過程非常快,這是ESN的優點之一。另外,對於一維時序數列的處理和預測,ESN有很好的優勢。但對於高維的時序數列,比如說視頻幀處理,ESN就不太能勝任了。

為了讓這個網絡能夠正常的運轉,還有一些地方是需要注意的:

之所以叫回聲狀態網絡,是因為前面時刻輸入的信息會通過WW回回盪在儲備池中,就像回聲一樣。為了避免儲備池狀態爆炸,WW的特征值必須要小於等於1。這也就引入了ESN中譜半徑的概念:WW的最大特征值。

由於網絡中只有WoutWout是可變的,為了盡可能多的表示不同的數據規律,WW必須要設置的非常大,才能從中找出各種不同的特征進行輸出。另一方面,WW的稀疏性也很重要,Hinton在多倫多大學的公開課里解釋是:建立一個松散的連接,這樣某一信息可以在網絡中的一小部分回盪,而不會迅速的傳播到其他部分。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM