來源: http://blog.csdn.net/minenki/article/details/8606515
1 圖(graph)、頂點(vertices)、邊(edges)
圖由頂點和邊組成,是表示物件與物件(objects)之間的關系的方法。在其他的術語中,圖也被稱作網絡(network),頂點被稱作結點(nodes),邊被稱作鏈接(links)。
圖的數學表示:,其中V是頂點集:
; E是邊集:
2 頂點相鄰(adjacent)
兩個頂點被一條邊相連,就說這兩個頂點是相鄰的(換句話講,如果說某兩個頂點是相鄰的,也就是指這兩個頂點之間有邊),這兩個頂點互為鄰居頂點(neighbor vertices)。
3 聚類系數(clustering coefficient)
頂點的聚類系數:一個頂點,它有K個鄰居頂點【鄰居頂點概念見上邊“2 頂點相鄰“】,這k個鄰居頂點之間實際存在的邊的個數比上這k個鄰居頂點最多可能存在的邊的個數(也即),這個比值就是這個頂點的聚類系數。
如圖2(a)中藍色頂點有3個白色鄰居頂點,這3個鄰居頂點實際有邊3條(黑色加粗線條所示),而3個鄰居頂點最多可能邊數是3*(3-1)/2=3 ,因此最后的聚類系數CC=3/3=1
如圖2(b)中藍色頂點有3個白色鄰居頂點,這3個鄰居頂點實際有邊0條(黑色加粗線條所示),而3個鄰居頂點最多可能邊數是3*(3-1)/2=3 ,因此最后的聚類系數CC=0
頂點的聚類系數又被稱為局部聚類系數(local clustering coefficient)。
圖2:頂點的聚類系數(a)CC=1 (b)CC=0
圖的聚類系數:一個圖中所有頂點的聚類系數的平均值為這個圖的聚類系數。也被稱作網絡的平均聚類系數(networkaverage clustering coefficient)
4 頂點的度(degree),圖的平均度(average degree),度分布(degree distribution)
頂點的度:一個頂點的度是指與該頂點相連的邊的個數。有向圖的頂點的度還可以細分為入度和出度,入度是以該頂點為頭(head)的邊的條數,出度是以該頂點為尾(tail)的邊的條數。
一個圖的平均度(average degree)是:
其中N是圖中頂點的個數。
一個圖的度分布是:整個圖中頂點的度的概率分布。
例如,如果一個圖共有N個頂點,其中Ni個頂點的度是K,那么這個圖的度分布P(K)=Ni/N。
很多社會網絡的度分布服從冪法則(power law),即。
冪律分布也稱為無標度分布(scale free distribution)。
5 完全圖(complete graph)
每一對不同頂點恰有一條邊相連,即每一對不同頂點都是相鄰的,則一個圖稱為完全圖。
n個端點的完全圖以Kn 表示,有n個端點及條邊【完全圖的n個頂點的任意兩個頂點恰有一條邊,求邊數相當於一個組合問題】。舉例如下圖:
圖3:完全圖舉例
6 派系(clique)
一個無向圖的一個派系是指:這個無向圖的頂點集有這樣一個子頂點集,子頂點集里的任意兩個頂點都有一條邊相連(也即子頂點集中的任意兩個頂點都是相鄰的),那么這個子頂點集及其邊構成的圖就是這個無向圖的一個派系。如果這個派系的頂點有k個,就稱這個派系為k-派系(k-clique)。
其實也就是一個無向圖里的一個子完全圖就是這個無向圖的一個派系。
下面這個圖共有23個1-派系(也即這個圖的所有頂點個數)、42個2-派系(也即圖中的所有邊)、19個3-派系(圖中所有藍色區域標出的三角形)、2個4-派系(圖中深藍區域的四邊形)
圖4:派系舉例
7 路徑(path),簡單路徑(simple path), 最短路徑(shortest path),平均最短路徑長度(average shortest path length),圖的直徑(diameter),連通圖(connected graph),連通分量(connected component)
路徑:如圖1(a)中,[A-B-E-C]就是頂點A到頂點C的一條路徑。
簡單路徑:路徑中沒有重復頂點的路徑叫做簡單路徑,[A-B-E-C]就是一條簡單路徑。
最短路徑:如圖1(a)中,頂點A到頂點C的最短路徑是 [A-C]
平均最短路徑長度:一個圖中所有任意兩點間的最短路徑的平均值。
圖的直徑:圖中所有的任意兩頂點間的最短路徑中,最長的那個最短路徑被定義為這個圖的直徑。
連通圖:圖中任意兩頂點都可以由一條路徑連接起來,這個圖就是連通圖。
連通分量:一個圖的最大的連通的子圖。
8 圖的類型:二分圖(Bipartite graphs),隨機圖(Random graphs),正則圖(Regular graphs),無標度圖(Scale-free graphs),小世界圖(Small-world graphs)
二分圖:一個無向圖的頂點集可分割為兩個互不相交的子集,並且圖中每條邊所關聯的兩個頂點分別屬於這兩個不同的頂點子集(也就是說每個頂點子集里的頂點不相鄰),這個圖可以稱為一個二分圖。
下圖就是一個二分圖,因為這個圖的頂點集可以這樣划分:{1,2,3}和{4,5,6,7},頂點子集{1,2,3}中的三個頂點不相鄰,頂點子集{4,5,6,7}中的四個頂點也不相鄰,符合二分圖條件。
圖5:二分圖
隨機圖:圖中的邊是隨機生成的,即任意兩個頂點之間有一條邊的概率為P。
正則圖:如果圖中所有頂點的度皆相等,則此圖稱為正則圖。
無標度圖:圖的度分布服從冪律分布的圖為無標度圖。
小世界圖:圖中任意兩個頂點之間的路徑都非常小的圖(例如地球上任意兩個人之間的平均距離是6,人際關系圖就是一個小世界圖)。
9 兩個圖的積:笛卡爾積圖(Cartesian product graph),直積圖(direct product graph),圖的合成圖(Lexicographical product graph)
兩個圖的積是指由兩個圖G1 和 G2 生成一個新圖 H 的操作:要求 新圖H 的頂點集(vertex set)是 G1 和G2頂點集的笛卡爾積,即;而當且僅當u1,u2,v1,v2滿足特定的條件時,新圖H 中的兩頂點 (u1,u2)和(v1,v2)之間才有邊相連。
圖5:G1和G2
如圖5所示兩圖,G1 和G2的各類積圖定義如下:
笛卡爾積圖:對於頂點集V= 中的任意兩個頂點 u=(u1,u2)和 v=(v1,v2),當u1=v1 且 在G2中 u2 adj v2 或者 u2=v2 且 在G1中 u1 adj v1 時,把頂點u和v相連, 如此得到的新圖稱為G1 和 G2的笛卡爾積圖。
(注:adj 是 adjacent 相鄰的縮寫, 在G1中 u1 adj v1,即指 u1 和 v1在圖G1中相鄰,也即u1和v1之間在圖G1中有邊相連。)
例子:根據定義,G1和G2的笛卡爾積圖的頂點集是={(1,3),(1,4),(1,5),(2,3),(2,4),(2,5)},根據條件,如頂點(1,3)和(1,4),滿足1=1, 且 3 與4 在圖G2中相連的條件,故頂點(1,3)和(1,4)之間有邊,依次類推,G1和G2的笛卡爾積圖如下所示。
圖6:G1和G2的笛卡爾積圖
直積圖:對於頂點集V= 中的任意兩個頂點 u=(u1,u2)和 v=(v1,v2),當 在G1中 u1 adj v1 且 在G2中 u2 adj v2 時,把頂點u和v相連, 如此得到的新圖稱為G1 和 G2的直積圖。
例子:根據定義,G1和G2的直積圖的頂點集是={(1,3),(1,4),(1,5),(2,3),(2,4),(2,5)},根據條件,如頂點(1,3)和(2,4),滿足 1和2在圖G1中相連 且 3 與4 在圖G2中相連的條件,故頂點(1,3)和(2,4)之間有邊,依次類推,G1和G2的直積圖如下所示。
圖7:G1和G2的直積圖
合成圖:對於頂點集V= 中的任意兩個頂點 u=(u1,u2)和 v=(v1,v2),當在G1中 u1 adj v1或者當 u1= v1 時,在G2中 u2 adj v2 時,把頂點u和v相連, 如此得到的新圖稱為G1 和 G2的合成圖G1[G2]。
例子:根據定義,G1和G2的合成圖的頂點集是={(1,3),(1,4),(1,5),(2,3),(2,4),(2,5)},根據條件,如頂點(1,3)和(2,4),滿足 1和2在圖G1中相連 ,而(1,3)和(1,4)滿足1=1,3和4在圖G2中相連,故頂點(1,3)和(1,4)之間有邊,依次類推,G1和G2的合成圖G1[G2]如下所示。
圖8:G1和G2的合成圖G1[G2]
參考
《復雜網絡理論及其應用》
《GRAPH-BASED NATURAL LANGUAGE PROCESSING AND INFORMATION RETRIEVAL》
Wikipedia:clustering coefficient,Path(social network),complete graph,clique(graph theory),degree distribution ,graph product