LSTM
其中:
ft為遺忘門,it為輸入門,gt為輸入,ot為輸出門
weight_ih_l0 = wii wif wig wio 是x的變換
weight_hh_l0 = whi whf whg who 是h的變換
假設為一層的lstm, 將m維向量映射為n維
那么ct, ht均為n維, Wii均為nxm維,weight_ih_l0為4nxm維,Whi均為nxn維,weight_hh_l0為4nxn維
假設為多層的lstm, 那么除了第一層之外,后面的層數都是4nxn的
it=σ(Wiixt+bii+Whiht−1+bhi)ft=σ(Wifxt+bif+Whfht−1+bhf)gt=tanh(Wigxt+big+Whght−1+bhg)ot=σ(Wioxt+bio+Whoht−1+bho)ct=ft⊙ct−1+it⊙gtht=ot⊙tanh(ct)