盡管網絡科學和傳統的圖論關於基本概念的定義是一致的,但兩者在研究角度和研究方法上有着重要的區別。
傳統的圖論往往着眼於具有某種規則結構或者節點數較小的圖,因而往往在理論分析時可以采用圖示的方法直觀地看出圖的某些性質(如是否連通)。
然而,近年網絡科學研究中涉及的實際網絡往往包含數十萬甚至數百萬以上的節點,而且具有復雜的不規則拓撲結構。對於如此大規模的網絡不可能通過圖示的方法看出網絡的拓撲性質,而必須借助於強大的計算能力和統計方法。
此外,網絡科學不僅關注拓撲結構,而且更為關注拓撲結構的演化及其與網絡上的動力學行為之間的關系等。
網絡規模尺度上的巨大差異使得傳統圖論和網絡科學對所研究的相關問題的表述都會不一樣。
例如,在圖論中,如果去除某個頂點就使得一個圖從連通變為不連通,那么該頂點就稱為割點(Cut-vertex) ;如果去除某條邊就使得一個圖從連通變為不連通,那么這條邊就稱為橋( Bridge)。
但是,在規模巨大的復雜網絡中,去除單個節點或單條邊往往並不能對網絡的拓撲性質(如連通性)產生如此大的本質影響。
因此,網絡科學更為關心的是:要去除網絡中多少比例的節點或者邊才能對網絡的某個性質(如最大連通片的大小)產生本質影響?不同的去除策略是否會產生顯著不同的后果?對網絡的某種性質如何提高其對節點和邊的去除魯棒性?等等。
從更一般的科學范圍看,研究個體數量較少的系統和研究個體數量極大的系統往往采用不同的方法:在物理學中,前者可以采用精確的方法,如經典力學;后者則往往需要采用統計的方法,如統計力學。對於這種差異,經典的陳述是諾貝爾獎得主、物理學家Anderson於1972年在《Science》上發表的一篇挑戰還原論的經典文章“多則不同( More is different)”。文中立場鮮明地指出:
“由大量基本粒子構成的復雜系統的集體行為並不能依據少數粒子的性質做簡單外推就能理解。正好相反,在復雜性的每一個層次都會呈現全新的性質,而要理解這一行為所需要做的研究,就其基礎性而言,與其他研究相比毫不遜色。”
從哲學的觀點看,這就是從量變到質變。例如,單個銅原子是不會導電的,因為電子被原子核拉住了。然而,由數量巨大的銅原子構成的一根銅絲卻能導電。這種導電特性就是巨量的銅原子聚合之后所涌現出的一種新的與單個銅原子完全不同的特性。日常生活中有許多這樣的由數量巨大的個體組成的系統會涌現出與單個個體不同的性質的例子。
近年來,人們在刻畫復雜網絡結構的統計特性上提出了許多概念和方法,並且利用了統計物理中的許多方法,包括相變和滲流理論、平均場理論、主方程方法等。2002年 Barabasi和 Albert發表的綜述文章的標題就是“復雜網絡的統計力學”。
復雜網絡的連通性
無向網絡中的巨片(Giant component)
網絡平均距離和直徑等概念嚴格說來只有對於連通圖才是有限值。
經驗和實證研究表明,許多實際的大規模復雜網絡都是不連通的,但是往往會存在一個特別大的連通片,它包含了整個網絡中相當比例的節點,這一連通片稱為巨片( Giant component) 。
如下圖所示,具有單個連通巨片的網絡示意:
一些關於網絡的拓撲性質的研究往往是針對巨片來進行的。實際網絡中不僅往往存在巨片,而且巨片幾乎總是唯一的。這一點仍然可以通過對社會網絡的直覺來推斷。假設社會網絡中存在兩個巨片,每個都包含數以千萬計甚至數以億計的人,只要某一天分別屬於兩個片的兩個人偶然相識,也就在這兩個片之間對應地有一條邊相連,那么這兩個巨片就合並成為了一個更大的巨片。
再有一個實例是全球最大的社交網站Facebook上的活躍用戶之間的朋友關系網絡。
2011年5月, Facebook 上大約有7.21億個活躍用戶以及687億條朋友關系鏈,節點數超過當時全球人口的10%。
這里,如果一個Facebook注冊用戶在2011年5月測量數據之前的最近28天時間里至少登錄過一次並且至少有一個Facebook朋友,那么就稱該用戶為活躍用戶,這里把那些只是注冊過但幾乎從不使用或者沒有朋友的孤立用戶剔除掉。
對於一個包含多個連通片的網絡,可以繪制該網絡的連通片規模的分布。
下圖給出了雙對數坐標下Facebook 網絡中不同規模的連通片的數量。圖中最右端的一個黑點對應於最大的連通片(即巨片),它包含了網絡中99.91%的節點。其余的連通片數量很多但規模都很小,第二大連通片僅包含不到3 000個節點。
有向網絡中的蝴蝶結結構(Bow-tie structure)
實際的大規模有向網絡往往既不是強連通也不是弱連通的,但是許多有向網絡往往有一個包含了網絡中相當部分節點的很大的弱連通片,稱為弱連通巨片( Giant weakly connected component,GWCC)。這一弱連通巨片又往往具有一種包含4個部分的蝴蝶結結構(Bow-tie structure) :
強連通核( Strongly connected core , SCC)
也稱為強連通巨片(Giantstrongly connected component),它位於網絡的中心。SCC中任意兩個節點之間都是強連通的,即存在從任一節點到另一節點的有向路徑。
入部(IN)
包含那些可以通過有向路徑到達SCC但不能從SCC到達的節點。
也就是說,一定存在從IN中任一節點到SCC中任一節點的有向路徑;反之,從SCC中任一節點出發沿着有向邊都無法到達IN中的一個節點。
出部(OUT)
包含那些可以從SCC通過有向路徑到達但不能到達SCC的節點。
也就是說,一定存在從SCC中任一節點到OUT中任一節點的有向路徑;反之,從OUT中任一節點出發沿着有向邊都無法到達SCC中的一個節點。
從IN中任一節點到OUT中任一節點必然存在有向路徑,而且該路徑必經過SCC中的某些節點。
卷須(Tendrils )
包含那些既無法到達SCC也無法從SCC到達的節點。
對於掛在IN上的任一卷須節點,必至少存在一條從IN中某一節點到該節點的不需經過SCC的有向路徑;
對於掛在OUT上的任一卷須節點,必至少存在一條從該節點到OUT中某一節點的不需經過SCC的有向路徑。
此外,還有可能存在從掛在IN上的卷須節點到掛在OUT上的卷須節點的不經過SCC的有向路徑,這些串在一起的卷須節點稱為管子(Tube)。
下表和下圖說明的是超過2億個頁面和15億個鏈接的WWW樣本的蝴蝶結結構。
在 WWW 樣本上:
- 包含30%左右網頁的強連通核,對應於可以通過鼠標點擊超鏈接在有限步內互相到達的“核心網頁”。
- 包含24%左右網頁的入部,對應於可以通過超鏈接在有限步內到達“核心網頁”但是無法返回的“源網頁”。
例如,你設計的一個網頁上有超鏈接指向某個“核心網頁”,但通常並不存在從“核心網頁”指向你的網頁的超鏈接。 - 包含24%左右網頁的出部對應於從“核心網頁”的鏈接中指出來卻無法回到“核心網頁”的“目標網頁”。
例如,你在搜索文章時,從Google 主頁開始,找到某位教授的主頁,然后找到該教授的文章列表,然后點擊相應的文章。但是你從該文章對應的頁面通常無法通過超鏈接再返回到Google主頁。
當然,強連通核未必一定就是蝴蝶結結構中節點數最多的部分。
例如,Vitali等人研究了由全球43060家跨國公司基於股權所有關系構建的有向的經濟網絡,在該網絡的蝴蝶結結構中,出部是最大的部分,而強連通片只占很小部分。蝴蝶結也是生物網絡中常見的一種結構”。從更一般的意義看,蝴蝶結作為復雜的技術和生物網絡中常見的一種系統結構可能有助於在效率、魯棒性和進化能力等方面保持一種平衡。
參考:
[1] 汪小帆,李翔,陳關榮.網絡科學導論[M].北京:高等教育出版社,2012