寫論文的理論基礎吧,整理一下。
生活中網絡隨時可見,小到微博網絡、游戲網絡等等,大到金融網絡、交通網絡、電力網絡、社交網絡等等,這些種種的網絡中都充滿着復雜性,為研究其中的奧秘,利用網絡科學理論進行刻畫,往往會得到意想不到的結果。
1、復雜網絡基本性質
1.1、節點的度
在網絡結構中,度是刻畫單個結點屬性的最簡單但卻最重要的概念之一。
在無向網絡中,節點i的度ki定義為與節點直接相連的邊的數目。無向網絡中所有節點的度的平均值為平均度,記為< k >。
給定無向網絡G中的鄰接矩陣A=(aij)N×N,則有:
網絡節點的度與網絡邊數M之間則有以下關系:
在有向網絡中,節點的度包括出度和入度,有ki=kouti+kini。節點i的出度kouti指從節點i到其他節點的邊的數目;入度kini指從其他節點到節點i的邊的數目。它們可以通過鄰接矩陣的元素表示:
有向網絡中,網絡的平均出度和平均入度相同,即有:
度分布是從統計概率角度觀察網絡結構特征的常用方式。
無向網絡的度分布P(k)定義為網絡中一個隨機選擇的節點的度為k的概率。
有向網絡的出度分布P(kout)定義為網絡中隨機選擇的一個節點的出度為kout的概率;入度分布P(k)in定義為網絡中隨機選擇的一個節點的入度為kin的概率。
在復雜網絡的模型中,通常將網絡的度分布分為兩類:泊松分布和冪律分布。
當網絡度分布近似於泊松分布的網絡時,該網絡為均勻網絡;當網絡度分布近似於冪律分布的網絡時,該網絡為非均勻網絡。
泊松分布滿足:
冪律分布滿足:
其中γ>0為冪指數,通常取值在2與3之間。
1.2、平均路徑長度與直徑
網絡的平均路徑長度L定義為任意兩個節點之間的距離的平均值,即有:
其中,N為網絡節點數。網絡的平均路徑長度又稱為網絡的特征路徑長度或平均距離。
網絡中任意兩個節點之間的距離的最大值稱為網絡的直徑,記為D,即有:
通常,在實際網絡中,網絡直徑指任意兩個存在有限距離的節點之間的距離的最大值。
1.3、聚類系數
“你的兩個朋友也可能互為朋友”描述了人際關系的密切聯系,可將這種屬性定義為網絡的聚類特性。
給定一個網絡G,鄰接矩陣A=(aij)N×N,節點i的度ki,節點i的聚類系數Ci,節點i的ki個鄰居節點之間實際存在的邊數Ei,則有:
將C定義為平均聚類系數,則有:
顯然有0≤C≤1。C=0,當且僅當網絡中所有節點的聚類系數均為0;C=1,當且僅當網絡中所有節點的聚類系數均為1,此時網絡為全局耦合的,即網絡中任意兩個節點都直接相連。
2、復雜網絡模型
2.1、ER隨機網絡
ER隨機網絡全稱為 埃爾德什(Paul Erdos)- 雷尼(Alfred Renyi)隨機網絡。生成該網絡的算法描述如下:
①從第N個孤立節點開始;
②選擇一對節點,產生一個0-1之間的隨機數。如果該隨機數小於p,則這對節點之間放一條連接;否則,該節點對保持不連接;
③對所有N(N-1)/2個節點對重復步驟②。
ER隨機網絡如下所示:
圖中,包含N=50個節點,連邊概率p=0.05。圖中的顏色隨節點度的變化而變化,度大的節點顏色深,度小的節點顏色淺。
2.2、WS小世界網絡
1998 年,Watts 博士及 Strogatz 教授在《Nature》上發表《Collective dynamics of ’small-world’ networks》,由此提出了 WS 小世界網絡模型。生成該網絡的算法描述如下:
①從規則圖構建:給定一個含有N個點的環狀最近鄰耦合網絡,其中每個節點都與它左右相鄰的各K/2個節點相連,K為偶數。
②隨機化重連:以概率p隨機地重新連接網絡中原有的每條邊,即把每條邊的一個端點保持不變,另一個端點改取為網絡中隨機選擇的一個節點。其中,規定任意兩個節點之間不得有重邊和自環。
綜上,p=0對應於完全規則網絡,p=1對應於完全隨機網絡,通過調節參數p的值就可以實現從規則網絡到隨機網絡的過渡,如下圖所示:
WS小世界網絡模型如下所示:
圖中,包含N=50個節點,K=3,連邊概率p=0.4。圖中的顏色隨節點度的變化而變化,度大的節點顏色深,度小的節點顏色淺。
WS 小世界的聚類系數 C(p)為:
WS 小世界網絡的聚類系數和平均路徑長度隨重連概率的變化趨勢如下:
由此,小世界特性指平均路徑長度較小、而聚類系數較大。
2.3、BA無標度網絡
Barabasi和Albert指出,ER隨機圖和WS小世界模型忽略了實際網絡的兩個重要特性,即增長特性(網絡的規模是不斷擴大的)和優先連接特性(新的節點更傾向於與那些具有較高連接度的hub節點相連接),故提出無標度網絡模型。生成該網絡的算法描述如下:
①增長:從一個具有m0個節點的連通網絡開始,每次引入一個新的節點並且連到m個已存在的節點上,這里m≤m0
②優先連接:一個新結點與一個已經存在的節點i相連接的概率∏i與節點i的度ki之間滿足如下關系:∏i=ki/∑jkj (分母為網絡中總的節點度)
BA無標度網絡模型如下所示:
圖中,包含N=100個節點。顏色隨節點度的變化而變化,度大的節點顏色深,度小的節點顏色淺。
若一個 BA 無標度網絡含有 N 個節點,其度分布符合(顯然具有冪律分布特點):
平均路徑長度:
聚類系數:
從聚類系數與平均路徑長度中可知,當節點數漸漸增多時,BA 無標度網絡的聚類特性並不明顯,但具有小世界特性。
3、經典傳染病模型
在經典的傳染病模型中,種群(population)內的N個個體的狀態可以分為如下幾類:
- 易感染狀態S(Susceptible)。一個個體在感染之前是處於易感染狀態的,即該個體有可能被鄰居個體感染。
- 感染狀態I(Infection)。一個感染上某種病毒的個體就稱之為是處於感染狀態,該個體還會以一定的概率感染其他鄰居個體。
- 移除狀態R(Recovery)。當一個個體經歷過一個完整的感染周期后,該個體就不再被感染,因此就可以不再考慮該個體。
3.1、SI模型
SI模型中將人群分為兩大狀態:易感染狀態S,感染狀態I。這里記s(t)和i(t)為t時刻易感染人群和感染人群占整個人群數量的比例,且s(t)+i(t)=1。設每一個易感染個體在單位時間內與感染個體發生關聯且被傳染的概率為β。
SI模型圖:
SI模型傳播動力學方程:
SI模型狀態變化圖:
可以看出,易染人群的數量處於遞減的狀態,而感染人群的數量處於增長的狀態。
3.2、SIS模型
SIS模型中將人群分為兩大狀態:易感染狀態S,感染狀態I。這里記s(t)和i(t)為t時刻易感染人群和感染人群占整個人群數量的比例,且s(t)+i(t)=1。設每一個易感染個體在單位時間內與感染個體發生關聯且被傳染的概率為β;每一個感染個體以定長速率γ再變為易感染個體。
SIS模型圖:
SIS模型傳播動力學方程:
SIS模型狀態變化圖:
可以看出,隨着時間的推移,兩種狀態的人群會保持成為一種穩定狀態。
3.3、SIR模型
SIS模型中將人群分為兩大狀態:易感染狀態S,感染狀態I,免疫狀態R。這里記s(t)、i(t)和r(t)為t時刻易感染人群、感染人群和免疫人群占整個人群數量的比例,且s(t)+i(t)+r(t)=1。設每一個易感染個體在單位時間內與感染個體發生關聯且被傳染的概率為β;每一個感染個體以定長速率γ再變為易感染個體。
SIR模型圖:
SIR模型傳播動力學方程:
SIR模型狀態變化圖:
可以看出,在傳播初期,三種狀態個體密度並無大的變化;但隨着時間的推移,易感態個體密度迅速下降,直到易感態個體密度為 0;而感染態密度迅速漸上升。當易感態個體密度為 0 時,感染態密度達到最大值。感染態密度增長的過程中,有部分感染態個體以概率γ恢復為免疫態個體。當感染態密度達到最大值后,群體中只存在這兩種狀態:感染態,免疫態。隨着時間的推移,所有的感染態個體轉變為免疫態個體。
4、傳播臨界值分析
4.1、均勻網絡的臨界值分析
如果一個易染節點的鄰居節點中至少有一個感染節點,該節點被感染的概率設為常數β,而一個感染節點恢復到易染節點的概率假設為常數γ。則定義有效傳播率λ=β/γ。一般地,可假設γ=1,因為這只會影響疾病傳播的時間尺度。
現在,令p(t)為時刻t感染個體密度,當時間t趨於無窮大時,感染個體的穩態密度記為ρ。均勻網絡(如ER隨機圖和WS小世界網絡)的度分布在網絡平均度< k >處有個尖峰,而當k << < k > 和 k >> < k >時指數下降,因而我們假設均勻網絡中每個節點的度ki都近似等於< k >。基於平均場理論,當網絡規模趨於無窮大時,通過忽略不同節點之間的度相關性,可得反應方程:
令上式右端為0,可以求得感染個體的穩態密度ρ如下:
其中,傳播臨界值為:
在均勻網絡中,存在一個有限的正的傳播臨界值λc:當傳播率λ<λc,則感染個體呈指數衰減,無法擴散;當傳播率λ>λc,則感染個體能夠將病毒傳播擴散並使得整個網絡感染個體總數最終穩定於某一平衡狀態。
4.2、非均勻網絡的臨界值分析
在均勻網絡中,假設每個節點的度都近似等於網絡平均度< k >。而在非均勻網絡中,節點度具有明顯的區別,此時需要對不同度值的節點作不同處理。令相對密度ρk(t)為度為k的節點被感染的概率。基於平均場理論,得平均場方程為:
令上式右端為0,可得ρk(t)的穩態值ρk:
這表明節點的度越高,被感染概率越高。由於網絡的非均勻性,對於度不相關的網絡,由於任意一條給定的邊連接到度為s的節點的概率為P(s|k)=sP(s)/< k >,可以求得:
綜上,即得:
上式中,有一個平凡解θ=0。傳播臨界值λc必須滿足:λc<λ時可以得到θ的一個非零解,即滿足如下條件:
即有:
從而,可以得到有效傳播率λ的傳播臨界值λc:
對於非均勻網絡,當網絡規模 N 趨近於無窮大時,導致< k2 > 趨近於無窮大,從而導致傳播臨界值λc趨近於零,故而非均勻網絡幾乎無傳播閾值,病毒會在很短的時間內傳播至全網。
5、復雜網絡的免疫策略
選擇合適的免疫策略對於傳染病的預防和控制極為重要。
5.1、隨機免疫
隨機免疫方法是完全隨機地選取網絡中的一部分節點進行免疫,它可以用作檢驗其他有針對性設計的免疫方法的效果的基准。定義免疫節點密度為g,由平均場理論,隨機免疫相當於把傳播率從λ縮減為λ(1-g)。
對於均勻網絡,
隨機免疫對應的免疫密度臨界值gc為
對應的穩態感染密度ρg為
對於非均勻網絡,如無標度網絡,隨機免疫的免疫密度臨界值gc為
當< k2 > →∞時,免疫密度臨界值gc趨於1。這解釋了,如果對於大規模無標度網絡采取隨機免疫策略,需要對網絡中幾乎所有節點都實施免疫才能最終消滅病毒傳染。
5.2、目標免疫
目標免疫就是希望通過有選擇地對少量關鍵節點進行免疫以獲得盡可能好的免疫效果。然而對於均勻網絡,網絡內的節點具有同質性,網絡連通性較高,即便是網絡中一部分節點被免疫,病毒依然可以通過其他未免疫節點傳播至全網。由於在無標度網絡上的傳播閾值趨近於零,隨機免疫策略會在無標度網絡上失效,因此該免疫策略是針對無標度網絡提出,在現實世界中,無標度性質更為廣泛。在無標度網絡上,可以選取度大的節點進行免疫。而這一些節點被免疫后,意味着這些節點在病毒傳播網絡中被移除,網絡被分裂為碎片,使得病毒的傳播存在有限的臨界閾值,從而幫助人們消滅傳染病。
在無標度網絡中,目標免疫的免疫臨界值gc滿足
可以看出,即使傳播率λ在很大的范圍內取不同的值,都可以得到很小的免疫密度臨界值。因此,有選擇地對無標度網絡進行目標免疫,其臨界值要比隨機免疫情形小得多。
5.3、熟人免疫
目標免疫需要了解網絡的全局信息以來尋找並控制傳染病傳播的 hub 節點。然而對與龐大復雜的且不斷演化的人類社會與Internet來說,無法從全局的角度找到這樣的節點,這樣做是非常難實現的。熟人免疫的基本策略是:從網絡中選取 p 比例的個體進行免疫,再從被選擇的個體中,隨機選擇他們鄰居中的節點進行免疫。該免疫策略可以避免知道全局信息的問題,從局部的角度進行出發,只需知道被隨機選擇的節點以及與它們直接相連的鄰居節點即可。
在無標度網絡中,度大的節點表明有許多的節點與之相連;若隨機選取一個節點,在選擇其鄰居時,度大的節點被選中的概率要高於度小的節點。因此熟人免疫策略的可操作性要高於目標免疫,且免疫效果要高於隨機免疫。