Siamese Network簡介

本文轉載自查看原文 2018-06-21 20:44 7958 數據挖掘及機器學習/ Siamese Network

Siamese Network 是一種神經網絡的框架，而不是具體的某種網絡，就像seq2seq一樣，具體實現上可以使用RNN也可以使用CNN。

簡單的說，Siamese Network用於評估兩個輸入樣本的相似度。網絡的框架如下圖所示

這里寫圖片描述

Siamese Network有兩個結構相同，且共享權值的子網絡。分別接收兩個輸入 $X_{1}$

訓練Siamese Network采用的訓練樣本是一個tuple $(X_{1}, X_{2}, y)$

LOSS函數的設計應該是
1. 當兩個輸入樣本不相似( $y = 0$

用 $L_{+} (X_{1}, X_{2})$

L w (X 1, X 2) = (1 - y) L - (X 1, X 2) + y L + (X 1, X 2)

Siamese Network的基本架構、輸入、輸出以及LOSS函數的設計原則如上文所述，接下來就說一下在NLP的場景，具體的Siamese Network應該如何設計。

LSTM Siamese Network

在文本方面，需要計算兩個文本之間的相似度，或者僅僅判斷是否相似，是否重復的場景也很多。簡單直接的方法可以直接從字面上判斷，使用BOW模型，使用SimHash算法都行。但是有些場景，字面上看可能不相似，但是從語義上看是相似的，這就需要更復雜的模型來捕捉它的語義信息了。

比如Quora就有這方面的需求，問答類型的網站希望同樣的問題只有一個就好，但表述問題的方式可以多種多樣，因此需要能夠捕捉到更多語義上的信息。

將Siamese Network架構中的用於表征 $X_{1}$

Learning Text Similarity with Siamese Recurrent Networks這篇文章介紹了這種網絡的結構，也給出了具體的參數。網絡的結構如下圖所示
lstm siamese network architecture

這是論文中的截圖，在文本輸入與BILSTM之間還有一個embedding層。

論文中的LSTM Siamese Network用了4層hidden unit size為64的BILSTM，再將每一時刻的輸出取平均作為輸入 $X$

這里的相似度 $E$

E (X 1, X 2) = X 1 X 2 | X 1 | | X 2 |

所以 $- 1 \leq E (X_{1}, X_{2}) \leq 1$

$y = 0$

具體的有

L + (X 1, X 2) = 1 4 ( 1 - E w ) 2

L - (X 1, X 2) = E 2 w,

總的LOSS函數不變。 $m$

lstm siamese network loss function

LSTM Siamese Network總結起來就是
1. 將Siamese Network中的Encoder換成BILSTM
2. 將距離的計算改成余弦距離
3. 修改相應的LOSS函數

這個設計上還是有一些可以改進的，比如在BILSTM輸出后，加一個attention，而不是直接average每個時刻的輸出，這樣可以更好的表征輸入的文本。

目前github上有一個開源實現，deep-siamese-text-similarity，但是代碼稍微有點亂，並且有些地方實現的不對。

比如BILSTM模型的定義中

outputs, _, _ = tf.nn.bidirectional_rnn(lstm_fw_cell_m, lstm_bw_cell_m, x, dtype=tf.float32) return outputs[-1]

將最后一個時刻的輸出作為表征向量，這樣就忽略了其它時刻的輸出。

還有定義兩個孿生網絡的時候，使用了不同的權值，根據Siamese Network的設計，在這里應該是要reuse_variable來共享權值的。

自己實現了一個，也放到github上：https://github.com/THTBSE/siamese-lstm-network。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Siamese Network理解 Siamese Network理解 <轉> 文本相似度模型siamese lstm network 孿生網絡（Siamese Network）在句子語義相似度計算中的應用 tensorflow實現siamese網絡(附代碼) 論文《Network in Network》筆記 network 和 NetworkManager Capsule Network Network Embedding network 和 NetworkManager