節點的度與網絡稀疏性



返回 我的研究方向(Research Interests)



節點的度

度(Degree)是刻畫單個節點屬性的最簡單而又最重要的概念之一。

度(Degree)

無向網絡中節點 i 的度 \(k_i\) 定義為與節點直接相連的邊的數目。
對於沒有自環和重邊的簡單圖,節點 i 的度 \(k_i\) 也是與節點 i 直接有邊連接的其他節點的數目。

對於加權網絡而言,度的概念仍然可以用,但是這時還可以定義節點的強度(Strength)。給定一個包含N個節點的加權網絡G及其權值矩陣W=$ ( w_{ij})$。如果 G 是無向加權網絡,那么節點 i 的強度定義為:

\[s_i=\sum_{j=1}^{N}w_{ij} \]

平均度(Average degree)

網絡中所有節點的度的平均值稱為網絡的平均度(Average degree),記為(k〉。

給定網絡G的鄰接矩陣A = \((a_{ij})_{N*N}\) ,我們有

\[K_i = \sum_{j=1}^{N}a_{ij}=\sum_{j=1}^{N}a_{ji} \]

\[<K> = \frac{1}{N}\sum_{i=1}^{N}K_{i} = \frac{1}{N}\sum_{i,j=1}^{N}a_{ij} \]

網絡節點的度與網絡邊數 M 之間有如下關系:

\[2M = N<K>=\sum_{i=1}^{N}K_i=\sum_{i,j=1}^{N}a_{ij} \]

即有

\[M = \frac{1}{2}N<K>=\frac{1}{2}\sum_{i=1}^{N}K_i= \frac{1}{2}\sum_{i,j=1}^{N}a_{ij} \]

\[<K> = \frac{2M}{N} \]

出度(Out-degree)與入度(In-degree)

有向網絡中節點的度包括出度(Out-degree)入度(In-degree)

節點 i 的出度 \(k_{i}^{out}\) 是指從節點 i 指向其他節點的邊的數目:

\[K_{i}^{out}=\sum_{j=1}^{N}a_{ij} \]

節點 i 的人度 \(k_{i}^{in}\) 是指從其他節點指向節點 i 的邊的數目:

\[K_{i}^{in}=\sum_{j=1}^{N}a_{ji} \]

一個看似平凡實則寓意深刻的事實是:
在有向網絡中,盡管單個節點的度和人度可能並不相同,網絡的平均出度\(〈K_{i}^{out}〉和平均入度〈K_{i}^{in}〉\)卻是相同的,
即有:

\[〈K_{i}^{out}〉=〈K_{i}^{in}〉=\frac{1}{N}\sum_{i,j=1}^{N}a_{ij}=\frac{M}{N} \]

從有向網絡的定義看,上式是顯然成立的。而且,它代表了一類復雜系統的一個重要特性:

對於系統中每個個體而言不一定成立的性質,卻會在整個系統的層面上成立。

WWW、微博用戶之間的關注網絡、論文引用網絡等都是具有這種特性的有向網絡。
這里以打電話為例說明。每個人累計打出電話的次數和接聽電話的次數一般而言不會恰好相等,但是全球打出電話的次數和接聽電話的次數總是相等的。

出強度(Out-strength)與入強度(In-strength)

如果 G 是有向加權網絡,那么節點i的出強度(Out-strength)和入強度(In-strength)分別定義為:

\[s_{i}^{out}=\sum_{j=1}^{N}w_{ij} \]

\[s_{i}^{in}=\sum_{i=1}^{N}w_{ij} \]


網絡稀疏性與稠密化

一個包含 N 個節點的網絡的密度(Density)ρ 定義為網絡中實際存在的邊數 M 與最大可能的邊數之比。
因此,對於無向網絡,網絡的密度(Density)ρ 有:

\[ρ = \frac{M}{\frac{1}{2}N(N-1)} \]

對於有向網絡,上式分母中的1/2去掉即可:

\[ρ = \frac{M}{N(N-1)} \]

實際的大規模網絡的一個通有特征就是稀疏性網絡中實際存在的邊數要遠小於最大可能的邊數。
例如,2011年5月的Facebook朋友關系網絡包含7.21億個活躍用戶和687億條邊,網絡平均度〈K〉≈ 190,密度\(ρ ≈0.3×10^{-7}\),意味着這是一個很稀疏的網絡。

實際網絡的規模一般也都是隨時間而演化的,而且許多實際網絡中節點和連邊的數量總體上在相當長的時間里都是呈現增加趨勢的。
因此,一個自然的問題是:隨着時間的演化,網絡是變得越來越稀疏,還是越來越稠密?此時,平均度〈k〉是一個更為合理的刻畫網絡稀疏性(或稠密性)的指標。
因此,平均度和網絡密度之間具有如下的簡單關系:

\[<K> = \frac{2M}{N}=(N-1)ρ≈Nρ \]

將時刻t網絡中的節點數和邊數分別記為N(t)和M(t)
如果兩者呈線性比例關系,即M(t) ~ N(t),那么上式可見,平均度〈k〉為―常數。
另一方面,如果兩者呈平方關系,即M(t) ~ \(N^2(t)\),那么就意味着,平均而言,每個節點都會與網絡中一定比例的其他節點直接相連,整個網絡會演化為一個非常稠密的網絡。
研究表明,許多實際網絡的演化是介於上述兩種情形之間的,即服從如下的超線性關系,也稱為稠密化冪律( Densification power law ):

\[M(t) - N^a(t),~~ 1<a<2 \]

這意味着,
一方面,相對而言,實際網絡會隨着時間的演化而變得越來越稠密;
另一方面,與稠密的全耦合網絡相比,實際網絡仍然是稀疏的。

對上式兩邊取對數,可以得到:

\[ ln M(t) ≈ aln(N(t))+c,~~ 1<a<2 \]

其中C為一常數。
這說明\(ln M( t)\)\(In N( t)\)的線性函數,也就是說,如果以\(ln N(t)\)為橫軸、 \(In M(t)\)為縱軸,我們應該會看到一條斜率為 α 的直線。
由於橫軸和縱軸都采用了對數坐標,我們稱對應的坐標系為雙對數坐標系。
下圖顯示了雙對數坐標系下的4種實際網絡的節點數和邊數之間的演化關系,可以看到它們都近似可以用斜率α∈ ( 1,2)的直線擬合。圖(a)—(d)對應的 α 值分別為1.68,1.66,1.18和1.15。
image


參考:

[1] 汪小帆,李翔,陳關榮.網絡科學導論[M].北京:高等教育出版社,2012


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM