第三章--網絡基本拓撲性質(復雜網絡學習筆記)
節點的度和平均度
- 度: \(節點i的度k指的是與節點i直接相連的邊的個數\)
- 出度: 節點\(i\)指向其他節點的邊數
- 入度: 其他節點指向節點\(i\)的邊數
- 平均度: 網絡中所有節點的度的平均值
- \(k_i\): 節點i的度
- \(<k>\): 網絡的平均度


如果是加權網絡G, 那么節點的度經過加權可以定義為出強度和入強度
網絡稀疏性和稠密化
- 網絡的密度: 一個包含\(N\)個節點的網絡的密度\(\rho\)定義為網絡中實際存在的邊數\(M\)與最大可能的邊數之比,即
\[\rho=\frac{M}{\frac{1}{2}N(N-1)} \]
對於有向網路, 上式中的1/2去掉即可.
如果當N趨於無窮大並且網絡密度是一個常數,則表明實際是網絡邊數與\(N^2\)是同階的, 那么則說該網絡是稠密的.
- 平均度: \(<k>=\frac{2M}{N}\)
- 密度 : \(\rho = \frac{M}{\frac{1}{2}N(N-1)}\)
- 平均度和密度的關系: \(<k>=(N-1)\rho \approx N\rho\)
平均路徑長度和直徑
平均路徑長度
- 最短路徑: 網絡中兩個節點之間的
邊數最少的路徑稱為最短路徑 - 距離\(d_{ij}\): 定義為節點i,j的最短路徑的邊數.
- 平均路徑長度\(L\): 定義為網絡中任意兩個節點距離的平均值
\[L=\frac{1}{\frac{1}{2}N(N-1)}\sum_{i>=j}d_{ij} \]

網絡直徑
- 網絡直徑D: 定義為網絡中任意兩個節點距離的最大值
\[D=max(d_{ij}) \]
實際上,我們可能更關心的是網絡中絕大部分用戶對之間的距離,因此先給出以下定義:
- \(f(d)\): 統計網絡中距離
等於\(d\)的連通的節點對占整個網絡中連通的節點對的比例 - \(g(d\)): 統計網絡中距離
不超過\(d\)的連通的節點對占整個網絡中連通的節點對的比例
一般的, 如果直徑\(D\)滿足
\[g(D-1)<0.9, g(D)\ge0.9 \]
那么就稱D為該網絡的有效直徑.
最短路徑算法
- Dijkstra算法: 一般用於求加權有向網路(權值為非負)中的節點之間最短路徑
- bellman-ford算法: 用於存在權值為負的情況
聚類系數(clustering coefficient)
- 某個節點的
聚類系數刻畫了該節點的鄰居節點中任意一對節點,有連邊的概率.
\[C_i=某個點的聚類系數=\frac{該點的鄰居節點之間實際存在的邊數}{這些鄰居節點可能存在的最大的邊數} \]
\[C_i=\frac{E_i}{k_i(k_i-1)/2}=\frac{2E_i}{k_i(k_i-1)} \]
其中
- \(E_i\) : 該點的鄰居節點之間實際存在的邊數
- $ k_i(k_i-1)/2$ : 這些鄰居節點可能存在的最大的邊數
度分布(degree distribution)
有連接才會有網絡, 我們自然關心網絡中節點的度的分布情況.
高斯分布(正太分布/鍾型分布)
正太分布是針對連續性隨機變量而言, 其對應的離散型隨機變量,最常見的是泊松分布(poisson distribution)
\[P(k)=\frac{\lambda^ke^{-\lambda}}{k!} \]

冪律分布(長尾分布/無標度分布)



冪律分布及其檢驗, 性質
用時再查閱資料.
