啦啦啦~過來填坑啦,今天終於出太陽了,開森~
將從以下五個方面進行展開(參考書籍《基於復雜網絡的機器學習方法》):
1.度和度相關性
2.距離和路徑
3.網絡結構
4.網絡中心性
5.復雜網絡度量方法的分類
1.度和度相關性
密度:衡量網絡中各個節點間的連接強度。將密度接近0的網絡稱為稀疏網絡。
網絡同配性:網絡同配性主要是根據網絡中節點的度,從網絡結構的角度考慮網絡中節點相連的可能性。同配系數r是一種基於度的皮爾遜相關系數。
r是正值時,表示度大的節點傾向於連接度大的節點; r是負值時,表示度大的節點傾向於連接度小的節點。
r=+1時,表示網絡具有很好的同配性; r=+1時,表示網絡具有很好的異配性。
社交網絡就表現出很明顯的同配性;而科技網絡,生物網絡以及金融網絡則表現出很強的異配性。
局部同配性:每個節點在整個網絡同配性中所占的比例。
非歸一化富人俱樂部系數:只關注節點與超過一定度數的節點相連的可能性。
歸一化富人俱樂部系數:消除了相同度分布下由結構所引起的差異,更能體現富人俱樂部效應的重要性。
2.距離和路徑
直徑:節點間的最大路徑長度稱為網絡的直徑。
節點偏心率:表示網絡中其他節點與其距離最長的路徑。
半徑:偏心率最小的節點間的距離。
維納指數:所有節點間距離的和。
網絡全局效率:網絡中信息傳播效率記為GE,它與網絡中節點間的距離成反比。
網絡平均一致估計:網絡全局效率的倒數稱為網絡的平均一致估計。
3.網絡結構
局部聚類系數:量化了局部積聚的能力。
網絡聚類系數:用於度量網絡的積聚情況。如果CC=1,說明網絡中所有點都是相連的,如果CC趨近於0,說明網絡的連接較為松散。
循環系數:描述了復雜網絡中的流通度。
網絡全局循環系數:網絡中所有節點的循環系數的平均值稱為網絡的全局循環系數。
模塊化系數:用來度量網絡中某一特定聚類的可能性,即度量網絡中聚類的強度。其取值區間為【0,1】.當模塊性接近0時,表明網絡中不存在社團結構,即網絡中的節點是隨 意相連的;隨着模塊化系數的增加,社團結構越來越清晰。模塊化系數定義了每個節點屬於某一社團的可能性,在網絡形成時根據模塊化系數確定節點是否屬於某一社團。
模塊化系數反映了模塊中節點的集中程度,而不是所有模塊之間的隨機分布。
拓撲重疊指數:度量網絡中大致處於相同社團的兩個點的連接程度。
4.網絡中心性
具有較大度數的節點是網絡的中心,而較小度數的節點通常是外圍或者末端的節點。度數較大的節點通常被稱為關鍵節點。
基於距離的網絡中心性:
極小極大准則:像醫院等急救場所的選址問題,確定一個使最大反應時間最小化的位置。
極小求和准則:例如購物中心等服務設施的選址,目標是盡量使總的路程時間最小。
在社交網絡分析中,基於這一概念的網絡中心性指標稱為親密度。
基於路徑的網絡中心性:主要考慮通過節點的路徑數量。
介數中心性:主要度量網絡中每對節點位於最短路徑上的程度。由於信息以相同的概率通過每一個節點,每條信息傳播中通過的節點數量只與節點所處的最短路徑的節點數量成比例。這一路徑上節點的數量為網絡的介數中心度數。
連通度:從節點p到節點q通過最短路徑和不同長度的隨機游走而進行信息傳遞的能力稱為連通度。
基於特征向量的網絡中心性:在定義中,當某一節點具有較大的特征向量中心性指數時,它的鄰域節點更重要,為關鍵節點。
Bonacich特征向量中心性算法:利用鄰接矩陣特征向量計算網絡中心性。
Katz指數:該指數用來確定個體在網絡中的重要性或狀態。
PagRank算法:谷歌用於網頁排名的著名算法。可以模擬用戶瀏覽網頁的行為。
特征向量中心性算法:節點的重要性取決於它的鄰域節點的重要性。
5.復雜網絡度量方法的分類
嚴格局部計算:度,強度等
混合計算:如局部聚類系數,拓撲重疊指數等
全局計算:如網絡全局效率,半徑等