deepwalk學習筆記

本文轉載自查看原文 2020-01-03 11:56 1067

DeepWalk

適應性：社交網絡是不斷變化的，當網絡發生變化時，可對對整個網絡新進行計算。
社區意識：節點在潛在表示的維度空間中的距離，應該表示網絡中對應的成員的相似度，以此保證網絡的同質性。
低維：當被標記的成員很少時，低維的模型一般表現的更好，並且收斂和推理速度更快。
連續性：需要通過圖的潛在表示來對連續空間中的部分社區成員進行建模。除了提供對社區成員資格的細微視圖之外，連續表示還可以使社區之間的決策界限平滑，從而實現更強大的分類。

1、隨機游走

將從頂點Vi開始的隨機游走序列表示為Wvi。Wvij表示序列Wvi中的第j個點。其中，Wvi1為Vi，Wvik+1是從Wvik的鄰居中隨機選擇的節點。隨機游走得到的序列中包含了網絡的局部結構信息。

當圖中節點的度遵循冪律分布（y=cx-r，y是度數為r的節點的出現的頻率；直觀上說，就是度數大的節點比較少，度數小的節點比較多）時，短隨機游走中頂點出現的頻率也將遵循冪律分布。

因為自然語言中單詞出現的頻率遵循類似的分布，所以用於建模自然語言分布的技術，可以用於對隨機游走得到的序列進行建模。

1、容易實現並行性。幾個隨機游走者（不同的線程，進程或機器）可以同時探索同一網絡的不同部分。

2、適應性。當圖變化后，不需要全局重新計算，可以迭代地更新學習模型

2、語言模型

語言建模的目標是估計出現在語料庫中的特定序列的可能性。即給定$W_n=（W_0,W_1,...,W_n）$ $的序列，其中$W_i \in V$，（$V$是詞匯表），我們想最大化$P_r（W_n|W_0，W_1,...，W_n-1）$，隨機游走得到的序列可以被認為是一種特殊語言的短句，類比語言建模可以得到：在隨機游走中給定迄今為止訪問的所有先前頂點的情況下，下一個頂點是的可能性可以表示為：$
$$$P_r(V_i|V_0,V_1,...,V_i-1)$$$
為了得到節點的潛在表示，引入映射函數$\Phi:v \in V \rightarrow R^{|V|*d}$，$|V|*d$ $矩陣$\Phi$表示圖中每個頂點的在d維空間中的潛在表示。這樣公式(1)可以表示為:$

$$P_r(V_i|V_0,V_1,...,V_i-1)$$

3.對語言建模進行relaxation 不是通過上下文預測單詞，而是使用單詞來預測上下文，上下文由單詞左右兩邊的單詞組成。（SkipGram） 不考慮句子中上下文出現的順序，最大化出現在上下文中的所有單詞的概率。對於頂點表示建模，就產生了下面的優化問題： $$P_r(V_i|V_0,V_1,...,V_i-1)$$ SkipGram使用獨立性假設，條件概率（3）近似為：    $$P_r(\{v_i-w,...,v_i+w\}/v_i| \Phi(V_i))=\prod_{j=i-w,j\neq w}^{i+w}(P_r(v_j|\Phi (v_i)))$$ DeepWalk算法 該算法由兩個主要組件組成：一個隨機游走生成器和一個語言模型更新程序。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 DeepWalk學習論文閱讀：DeepWalk Line 算法與deepwalk的對比和個人理解 DeepWalk論文精讀：（4）總結及不足論文解讀（DeepWalk）《DeepWalk: Online Learning of Social Representations》學習筆記1 DeepWalk論文精讀：（2）核心算法 Graph embedding（2）----- DeepWalk、Node2vec、LINE 【圖嵌入】DeepWalk 和 Node2Vec 使用DeepWalk從圖中提取特征