學自書籍:《網絡科學導論》高等教育出版社
1、引言:
尋找網絡中的關鍵節點是網絡科學的重要研究內容之一。
這一部分就是介紹 無向網絡中節點重要性排序的幾個常用指標,包括度值、介數、接近數、k-殼值和特征向量。 有向網絡中 節點重要性排序的兩個經典算法---HITS算法和PageRank算法都是來自WWW上的網頁排序。
鏈路預測的基本想法就是:兩個節點越是相似,那么它們之間就越有可能存在連邊,這里也介紹多種基於節點相似性的預測方法。
2、無向網絡節點重要性指標
2.1 度中心性
例如,一套房子的價值首先要看這套房子所在的地段。同樣的在復雜網絡中主要就是取決於 位置。也就是說一個節點的價值首先取決於這個節點在網絡中所處的位置,位置越中心的節點其價值也越大。
度中心性就是一個節點的度越大就意味着這個節點越重要。 (一個包含N個節點的網絡,所以節點最大可能的度值為N-1,度為 ki 的節點的歸一化的度中心性值定義為:)
2.2 介數中心性
如下圖,從度中心性來看,節點A、B、C都比節點H重要。現在假設有信息或者物質在節點之間沿着連邊流動,對應與網絡中的信息傳播、互聯網中的數據包發送等。如果兩個節點之間存在多條最短路徑,那么隨機選擇一條最短路徑,經過相當長一段時間后,每對節點間都傳送了許多包,現在問:哪個節點最繁忙,也就是經過哪個節點的包數量最多?
這種以經過某個節點的最短路徑的數目刻畫節點重要性的指標就稱為介數中心性,簡稱介數(BC)
gst為節點s到節點t的最短路徑的數目,nsti 為節點s到節點t的 gst條最短路徑中經過節點i的最短路徑的數目。
Newman給出的歸一化介數:
2.3 接近中心性
對於網絡中的每一個節點i,可以計算該節點到網絡中所有節點的距離的平均值,記為di ,即有:
其中di 是節點i到節點j的距離。這樣,就可以得到網絡的評價路徑長度的另一種計算公式:
di 在一定程度上反映了節點 i 在網絡中的相對重要性:di 的值越小意味着節點 i 更接近其他節點。我們把di 的倒數定義為節點i的接近中心性,簡稱接近數,用記號CCi 來表示:
2.4 k-殼與k-核
粗粒化的節點重要性分類方法, 即k-殼分解方法
1-殼:假設網絡中不存在度為0的鼓勵節點。如果我們把度為1的節點以及這些節點相連的邊去掉,這時網絡中優惠出現一些新的度為1的節點,我們繼續把這些節點及其連邊去掉,重復這個操作,直至網絡中不再有度為1的節點為止。這個操作相當於剝去一層殼,我們就把所有這些被去除的節點以及它們之間的連邊稱為網絡的1-殼(1-shell)。有時,網絡中度為0的鼓勵節點也稱為0-殼。
2-殼:在1-殼的基礎上繼續剝出度為2的那層殼。 以此類推。
下圖顯示了一個可分解為三層殼的簡單網絡。
2.5 特征向量中心性
基本想法:一個節點的重要性既取決於其鄰居節點的數量(即該節點的度),也取決於其鄰居節點的重要性。記xi 為節點i的重要性度量值,則:
其中c為一比例常數, A=(aij )仍然是網絡的鄰接矩陣。記x=[x1,x2....xn]T ,則上式可以寫成如下矩陣形式:
上式意味着x是矩陣A與特征值c-1對應的特征向量,故此稱為特征向量中心性。