1.復雜網絡:隨機網絡,小世界網絡和無標度網絡
2.小世界網絡的屬性:平均路徑長度(Average Path Length,APL)小於正則網絡的;小世界網絡具有較低的平均聚類系數(Average Clustering Coefficient,ACC)
3.復雜網絡面對的挑戰:高數據量;物理系統到真實復雜網絡模型映射過程中的復雜性;高計算復雜性
4.圖信號處理將經典信號處理中的概念和工具(如平移,卷積,傅里葉變換,濾波器組和小波變換)擴展應用於任意網絡中的數據
5.加權圖,有向圖
6.圖在計算機的存儲器中用矩陣表示,如鄰接矩陣,關聯矩陣,權重矩陣,度矩陣以及拉普拉斯矩陣等。
7.如果在兩個節點之間存在多條邊,稱該圖為多重圖(multigraph);如果存在自環,則稱該圖為偽圖(pseudograph)
8.包含原始圖所有頂點的子圖稱為生成子圖(spanning subgraph)
9.圖g的補圖是指與圖G具有同樣的頂點集,但邊集中的邊則由那些在圖g中不存在的邊組成,也稱為反向圖(inverse graph)
10.圖在計算機中以矩陣或者鏈表的方式存儲
11.權重矩陣:圖的權重矩陣包含圖中相應邊的權重。權重矩陣是圖的拓撲結構的完整表示。所有的其他矩陣(鄰接,度,拉普拉斯)都可以通過權重矩陣推導得出。對於非加權圖,權重矩陣和鄰接矩陣是一樣的。
12.鄰接矩陣:包含圖連接的N*N矩陣
13.關聯矩陣:每一行對應圖中的一個頂點,而每一列對應圖中的一條邊。
14.度矩陣:是一個對角線矩陣,在對角線上包含了頂點的度。節點的度是所有與該節點相關聯的邊的權重之和。一些大的網絡通常通過度的頻率分布來刻畫。
15.拉普拉斯矩陣:L=D-W,D是圖的度矩陣,W是圖的權重矩陣。具有正邊權重的無向圖的拉普拉斯矩陣的基本性質:對稱性;每一行之和為0,具有奇異性,det(L)=0;半正定;其特征值是非負實數。
16.歸一化拉普拉斯矩陣:L(norm)=D(-1/2)LD^(-1/2)
17.有向拉普拉斯矩陣:L=Din-W; Din是入度矩陣
18.基本圖測度:平均鄰居度(AND),平均聚類系數(ACC,局部連通性屬性),平均路徑長度(APL,全局網絡屬性),平均邊長度(AEL),圖的直徑和體積。
19.在隨機網絡中,APL值遠小於正則網絡,其原因在於該網絡中節點之間的連接具有隨機性特征。小世界網絡介於正則網絡和隨機網絡之間,包含了兩個網絡的最佳特性。小世界網絡具有較低的APL值和中等的ACC值。
20.平均邊長度:可以通過網絡中每條邊的長度之和與總邊數之間的比值來衡量。
21.圖的直徑:圖中任意兩個頂點之間距離的最大值;圖的體積:表示所有頂點度的和。
22.圖的基本定義和屬性:①途徑,路徑以及回路②連通性:若圖中任意節點對之間均存在一條路徑,則稱該圖是連通的;圖的頂點(邊)連通度是指為使圖變得不連通所需的最小節點(邊)數目;圖的割點是一個頂點,當移除該頂點后圖將變得不連通;若某條邊被移除后使得圖變得不連通,則該邊稱為圖的橋(bridge);在一個圖中,最大的不可分子圖稱為塊(block);割:一個連通圖的割是邊或者頂點的一個子集,移除該子集將導致圖不連通;無環圖指一個圖不包含回路或者環。DFS,深度優先搜索
23.同構(isomorphism):兩個圖具有相同的頂點數,並且這些頂點具有相同的連接方式,則稱他們同構
24.平面性:若圖能在一個平面上繪制並且任意兩條邊之間不存在相交,則稱該圖為平面圖。(平面嵌入planar embedding)
25.歐拉公式:如果一個連通平面圖G具有N個節點,E條邊和F個面,則
N-E+F=2
26.可着色性(五色定理和四色猜想)
27.可遍歷性:如果某個圖存在包含所有頂點但不重復經過邊的路徑,則稱該圖為可遍歷的。
28.歐拉圖:給定一個圖,確定是否存在經過所有頂點並在起始點結束的途徑,並且恰好遍歷每條邊一次,這樣的圖稱為歐拉圖。一個圖是歐拉圖當且僅當圖的所有頂點的度為偶數。至少一個頂點的度為奇數,則該圖不可能是歐拉圖。
29.哈密頓回路:遍歷圖的所有頂點恰好一次的途徑稱作哈密頓路徑。如果哈密頓路徑結束於起始點,則稱為哈密頓回路。一個包含哈密頓回路的圖稱為哈密頓圖。
30.網絡流:我們希望找出每分鍾能夠進入和離開該網絡的最大卡車數目,該問題即為經典的最大流問題。流圖是一個有向圖,其中給出了兩個特殊的節點--源節點和匯聚節點。最大流問題也可被叫做最小割問題。
31.最大流最小割定理:在具有單個源節點和單個匯聚節點的網絡中,從源節點到匯聚節點的最大可能流量等於網絡中所有可能的割中的最小割容量。
32.乘積圖:考慮兩個分別具有N1和N2個節點的圖g1=(v1,w1)和g2=(v2,W2)。乘積圖是一個具有N1N2個頂點的圖。其權重由w1,w2所導出。克羅內克積,笛卡爾積,強積。
33.圖的類型:正則圖,二分圖,樹,完全圖以及線圖等。
34.正則圖:每個節點的鄰接節點的數目是相等的。如果在正則圖中每個頂點的度是r,則稱為r-正則圖。
35.二分圖可以將圖划分為不相交的集合。
36.完全圖:每個節點都與圖中所有其他節點相連接。在一個具有N個節點的完全圖中,每個頂點的度是N-1,且總的邊數為N(N-1)/2.
37.樹:是一個不包括回路的連通圖。生成樹。最小生成樹(邊權重之和最小的生成樹)。Kruskal MST算法。
38.線圖:圖g的線圖L(g)是將原始圖g的邊變換為頂點。
39.沖突圖
40.圖的其他重要測度:Cheeger常數,團(圖中的一個完全子圖稱為團)數,圖尋路算法,dijkstra最短路徑算法,所有節點對之間的最短路徑算法。
第三章復雜網絡概述
1.現有的真實世界復雜網絡可以大致分為三類:隨機網絡,小世界網絡以及無標度網絡。
2.復雜網絡的測度:平均鄰居度,平均路徑長度,網絡直徑,平均聚類系數,度分布,中心性測度,度度相關性,節點臨界性,網絡電阻距離。
3.平均鄰居度(Average Neighbor Degree,AND):網絡中所有節點的度的平均值。用於確定網絡類型。刻畫了網絡的局部特性。
4.平均路徑長度(Average Path Length,APL):全局測度。是網絡中所有可能節點對之間的端到端路徑長度的平均值。
5.網絡直徑:降低網絡直徑有利於改善網絡中的傳輸延遲。
6.平均聚類系數(Average Clustering Coefficient,ACC):用來刻畫網絡的健壯性和冗余性。ACC越高,說明網絡被斷開的機會就越少。
7.度分布:小世界網絡的度服從高斯分布,無標度網絡的度服從冪律分布。
8.中心性測度:理解網絡結構和動態特性,度中心性,接近中心性,介數中心性,圖中心性,特征向量中心性,GFT中心性。
9.度中心性(Degree Centrality,DC):所有與該節點關聯的邊的權重之和。
10.接近中心性(Closeness Centrality,CC):描述了一個節點與其他節點的接近程度。CC還度量了在有向網絡中的其他節點擴散信息時節點的重要性。
11.介數中心性(Betweenness Centrality,BC):刻畫節點在實現網絡長距離通信中的重要性。
12.圖中心性(Graph Centrality,GCmetric):基於節點級的信息來標識網絡的中心化程度。
13.特征向量中心性(Eigenvector Centrality ,EC):根據相鄰節點的中心性來對其進行加權。
14.GFT中心性:GFT,graph fourier transform,圖傅里葉變換。GFT中心性同時考慮給定節點的局部影響和全局影響。利用圖譜來確定節點在圖中的中心性。
15.復雜網絡中的度---度相關性:度-度相關性描述了一個相互連接的節點對之間的關系,據此可以將網絡划分為:同配網絡(assortative network)和異配網絡(disassortative network)。
16.節點臨界性:通過節點權重歸一化后的節點隨機游走介數。
17.網絡電阻距離:表示將所有的邊替換為代表性電阻所得到的節點間的等效電阻。
18.復雜網絡的社區發現:三種典型的方法:模塊度最大化,Surprise最大化以及基於沖突圖變換的社區發現(CTCD)
19.模塊度最大化:模塊度M表示位於社區內的邊減去邊在沒有社區結構而隨機分布情況下的期望。
20.Surprise最大化:S取決於每個社區內的鏈路數和節點數。
21.復雜網絡中的熵:熵度量了消息中所包含的平均信息量。熵提供了一個很好的描述手段來刻畫鏈路和節點的特征。
22.網絡熵:定義為對網絡不確定性的一個度量。
23.節點度熵(Nodal Degree Entropy,NDE):基於節點的鄰居度計算得到。對於評價鄰居意義上的節點異構性非常有效。
24.鏈路長度變化熵(Link Length Variability Entropy,LLVE):度量了復雜網絡中鏈路長度的變化情況。
25.鏈路影響熵LInE:除了度量節點的重要性,還可以用於計算網絡影響的穩定性。根據來評價,復雜網絡具有如下的順序,正則網絡>小世界網絡>ER網絡>無標度網絡>空間無線網絡。
26.動態網絡中的LInE行為:鏈路影響的變化決定了節點的不穩定性,若網絡中隨時間發生變化的鏈路較少,則節點在網絡中更穩定。基於度的方法無法區分節點影響,不能有效觀察節點影響的變化,而基於LInE可以有效地度量不同時刻鏈路影響的變化,並且能夠正確估計節點影響的穩定性。
27.隨機網絡:隨機網絡的演進:根據已定的總的鏈路數;在節點對之間創建的概率已定。
28.ER隨機網絡模型的創建:N個節點基於概率P隨機地進行連接。
29.隨機網絡的屬性:包括期望網絡規模,平均鄰居度,網絡直徑,平均路徑長度,聚類系數,度分布,巨型分支的形成。
30.巨型分支的形成:當p的值增加時,隨機網絡的連通性也得到了加強,逐漸演進出一個大的節點簇,這個節點簇包含大量的連接,可以稱為巨型分支。
31.開放性研究問題:復雜網絡的一個具有挑戰性的問題是高效地檢測社區;設計和開發更快的算法來估計APL仍然是一個開放的研究問題;提出一個統一的中心性測度,既具有較低的時間復雜度,又能夠用於判別節點的局部和全局影響;復雜網絡中現有的社區發現算法經常試圖找到嚴格不相交的社區,需要設計新的測度來描述這種重疊參與的情況,需要設計新的算法以有效識別社區及其重疊情況;ER模型不能描述許多真實世界隨機網絡的形成以及演進行為,設計開發新的能夠解釋時間依賴網絡演進的網絡模型仍然是一個開放的研究問題。