簡介
對deepwalk的隨機游走方式做了改進,將網絡節點嵌入到低緯度向量空間中(deepwalk學習筆記:https://www.cnblogs.com/yyqxwh1128/p/12144232.html)
改進隨機游走方式
Random Walks
給源節點\(u\),模擬一個長為\(l\)的隨機游走。設\(c_i\)為游走的第\(i\)個節點,起始節點\(c_0=u\)。節點\(c_i\)服從一下分布:
\[P(c_i=x|c_{i-1}=v)=\begin{cases}\frac{\pi _{vx}}{Z}\;\;if(v,x) \in E\\\;0\;\;\;\;otherwise\end{cases} \]
其中,\(\pi _{vx}\)是沒有標准化的節點\(v\)到\(x\)的轉移概率,\(Z\)用於標准化
Search Bias α
改進的隨機游走有兩個參數\(p\)和\(q\)。假設剛游走完邊\((t,v)\),現在在節點\(v\)要根據轉移概率\(\pi _{vx}\)選擇下一個節點\(x\)。設\(\pi _{vx}=\alpha _{pq}(t,x)*\omega _{vx}\)
\[\alpha _{pq}(t,x)=\begin{cases}\frac{1}{p}\; \; if\; d_{tx}=0\\1\; \; \;if\; d_{tx}=1\\\frac{1}{q}\; \; if\; d_{tx}=2\end{cases} \]
\(d_{tx}\)表示節點t和x間最短距離,\(d_{tx}{ \in 0,1,2}\)。參數\(p\)和\(q\)相當於調節BFS和DFS的程度。
- 節點的可能性比較低;若\(p<min(q,1))\),會使得游走變得比較拘於局部。
- \(q\)稱為In-out parameter,\(q>1\),則游走會選擇距離\(t\)較近的節點,以此達到接近BFS的效果;若\(q<1\)游走會選擇離t更遠的節點,達到類似DFS的效果。
隨機游走的優點:時間復雜度和空間復雜度優於DFS/BFS,可以使得游走的范圍可控,避免游走局限的現象。