node2vec學習筆記


簡介

對deepwalk的隨機游走方式做了改進,將網絡節點嵌入到低緯度向量空間中(deepwalk學習筆記:https://www.cnblogs.com/yyqxwh1128/p/12144232.html)

改進隨機游走方式

Random Walks

給源節點\(u\),模擬一個長為\(l\)的隨機游走。設\(c_i\)為游走的第\(i\)個節點,起始節點\(c_0=u\)。節點\(c_i\)服從一下分布:

\[P(c_i=x|c_{i-1}=v)=\begin{cases}\frac{\pi _{vx}}{Z}\;\;if(v,x) \in E\\\;0\;\;\;\;otherwise\end{cases} \]

其中,\(\pi _{vx}\)是沒有標准化的節點\(v\)\(x\)的轉移概率,\(Z\)用於標准化

Search Bias α
改進的隨機游走有兩個參數\(p\)\(q\)。假設剛游走完邊\((t,v)\),現在在節點\(v\)要根據轉移概率\(\pi _{vx}\)選擇下一個節點\(x\)。設\(\pi _{vx}=\alpha _{pq}(t,x)*\omega _{vx}\)

\[\alpha _{pq}(t,x)=\begin{cases}\frac{1}{p}\; \; if\; d_{tx}=0\\1\; \; \;if\; d_{tx}=1\\\frac{1}{q}\; \; if\; d_{tx}=2\end{cases} \]

\(d_{tx}\)表示節點t和x間最短距離,\(d_{tx}{ \in 0,1,2}\)。參數\(p\)\(q\)相當於調節BFS和DFS的程度。

  • 節點的可能性比較低;若\(p<min(q,1))\),會使得游走變得比較拘於局部。
  • \(q\)稱為In-out parameter,\(q>1\),則游走會選擇距離\(t\)較近的節點,以此達到接近BFS的效果;若\(q<1\)游走會選擇離t更遠的節點,達到類似DFS的效果。

隨機游走的優點:時間復雜度和空間復雜度優於DFS/BFS,可以使得游走的范圍可控,避免游走局限的現象。

實驗


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM