平均路徑長度與直徑



返回 我的研究方向(Research Interests)



無權無向網絡情形

平均路徑長度

最短路徑(Shortest path)與測地路徑(Geodesic path)

網絡中兩個節點 i 和 j 之間的最短路徑(Shortest path)也稱為測地路徑(Geodesic path),是指連接這兩個節點的邊數最少的路徑。

節點 i 和 j 之間的距離 d ,定義為連接這兩個節點的最短路徑上的邊的數目,也稱為兩個節點之間的測地距離(Geodesic distance)或跳躍距離(Hop distance)

平均路徑長度( Average path length)

網絡的平均路徑長度( Average path length) L 定義為任意兩個節點之間的距離的平均值,網絡的平均路徑長度也稱為網絡的特征路徑長度( Characteristic path length)或平均距離(Average distance)。

\[L= \frac{1}{\frac{1}{2}N(N-1) }\sum_{i\ge j}^{}d_{ij} \]

其中N為網絡節點數。
對於下圖所示的一個包含5個節點和5條邊的簡單網絡
image
有L=1.7。
在朋友關系網絡中,平均路徑長度L是連接網絡內兩個人之間最短關系鏈中的朋友的平均個數。
盡管許多實際的復雜網絡的節點數巨大,網絡的平均路徑長度卻小得驚人,這就是所謂的小世界現象。

大型實際網絡往往是不連通的
此時,可能兩個節點之間不存在連通的路徑,即意味着這兩個節點之間的距離為無窮大,從而導致整個網絡的平均路徑長度也為無窮大。
為了避免在計算時出現這種發散問題,可以把網絡平均路徑長度定義為存在連通路徑的節點對之間的距離的平均值。這種方法對於存在一個包含相當部分節點的連通巨片的網絡較為適合。
另一種方法是把平均路徑長度定義為網絡中兩點之間距離的簡諧平均(Harmonic mean ) :

\[L = \frac{1}{GE} ,~~ GE= \frac{1}{\frac{1}{2}N(N-1) }\sum_{i\ge j}^{}d_{ij} \]

按照上式計算,兩點之間距離為無窮大對應於距離的倒數為零,由此得到的平均路徑長度總是有限值。
如果我們認為兩個節點之間距離越短,在它們之間發送信息的效率越高,也就是假設兩節點之間發送信息的效率與它們之間距離的倒數成正比,那么式中的GE就定量反映了網絡中節點之間發送信息的平均效率,因此GE也稱為全局效率( Global efficiency)。

網絡直徑(Diameter)

網絡中任意兩個節點之間的距離的最大值稱為網絡的直徑( Diameter),記為D,即

\[D= \max_{i,j} d_{ij} \]

考慮到實際網絡往往並不是連通的,而是存在一個連通巨片,
因此,在實際應用中,網絡直徑通常是指任意兩個存在有限距離的節點(也稱連通的節點對)之間的距離的最大值。

進一步地,我們可能更為關心的是網絡中絕大部分用戶對之間的距離。
為此,可以統計網絡中距離為 d 的連通的節點對的數量整個網絡中連通的節點對數量的比例,記為f(d);
並進而統計網絡中距離不超過 d 的連通的節點對的數量整個網絡中連通的節點對數量的比例,記為g(d)。
例如,下圖顯示了在 5 個不同的時間采集得到的全球和美國的Facebook朋友關系網絡中具有給定距離的用戶對 所占的比例。
image
下圖顯示的則是2011年5月份的全球和美國的Facebook朋友關系網絡中距離不超過給定值的用戶對所占的比例。
image
對於全球Facebook而言,任意兩個用戶之間距離不超過5的概率是92% ,不超過6的概率高達99.6% !
一般地,如果整數 D 滿足:

\[g(D-1)<0.9, ~~ g(D) ≥ 0.9 \]

那么就稱 D 為網絡的有效直徑(Effective diameter)
換句話說,D 是使得至少90%的連通的節點對可以互相到達的最小的步數。
我們可以通過插值的方式把有效直徑推廣到非整數的情形。為此,對任一實數r ,假設 d ≤ r < d+1,通過線性插值的方式定義g(r)如下:

\[g(r) = g(d) +(g( d +1) - g( d) )(r - d) \]

如果實數D滿足g(D) =0.9 ,那么就稱 D 為網絡的有效直徑。
從實際計算的角度看,整數和非整數的有效直徑定義之間的區別是可以忽略的。
有效直徑通常是一個比直徑更為魯棒的量,
因為去除網絡中少許幾條邊之后有可能會使原先距離較近的兩個節點之間的距離變得很長,但對網絡的有效直徑並沒有明顯影響。
image
上圖說明了Facebook 網絡的平均距離隨着時間的演化而呈現越來越小的趨勢。
研究表明,許多實際網絡的直徑和有效直徑都呈現越來越小的趨勢,也稱為直徑收縮( Shrinking diameters)現象。

加權有向網絡情形

上述關於無權無向網絡的討論都可以推廣到加權和有向的情形,只是需要注意在加權情形需要考慮邊的權值,在有向情形需要考慮邊的方向。

對於加權無向網絡,
兩個節點之間的最短路徑定義為連接這兩個節點的邊的權值之和最小的路徑。
兩個節點之間的距離即為最短路徑上邊的權值之和。

對於加權有向網絡,
從節點A到節點B的最短路徑是指從節點A到節點B的權值之和最小的有向路徑。

在加權網絡中,兩個節點之間邊數最少的路徑並不一定是權值之和最小的路徑。
在有向網絡中,從節點A到節點B的距離可能並不等於從節點 B 到節點 A 的距離,甚至可能存在從節點A到節點B的有向路徑但是不存在從節點B到節點A的有向路徑。

求解加權有向網絡上兩點之間最短路徑的經典算法是 Dijkstra算法。
該算法可以計算從一個源節點 s 到網絡中所有其他節點的最短路徑,其基本想法是為每個節點 v 保留到目前為止所找到的從節點 s 到節點 v 的最短路徑。


參考:

[1] 汪小帆,李翔,陳關榮.網絡科學導論[M].北京:高等教育出版社,2012


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM