03-motifs 圖機器學習之motif和結構角色


Motifs and Structure Roles in Networks
子圖/子網絡:subnetworks→network中的組成部分,可用於描述網絡特性或區分網絡
例子:3個節點的有向子圖的不同形態

對於每一個subgraph:
    假設我們有一度量工具可以用於對subgraph的重要性(顯著性?)進行評估:
       負值表示under-representation (不能很好的表征,欠表征?)
       正 值表示over-representation (過表征?)
定義網絡重要性(顯著性?)(network significance profile):一個特征向量,向量中的元素值為所有子圖的類型
那么,接下來,我們需要比較不同網絡的profiles:
從下圖中,橫軸是不同的子圖類型,縱軸是 歸一化后的z score( 應該是指重要度,但此處未給出重要度是如何計算出來的)。不同的曲線表示同類網絡中的不同地域/應用。由曲線可得,同類網絡具備相似的significance profiles
因此,今天的任務:
1)子圖: 定義及發現motifs和graphlet;
2)網絡的結構角色:RolX: Structural Role Discovery Method  發現工具
3)發現 Structural Role以及其的應用:結構相似度;角色生成與遷移學習;Making sense of roles

subgraph, motifs 和 graphlet
首先來看 network motifs:recurring, significant patterns of interconnections  重復出現的,具有顯著意義的連接模式
pattern:小型的,具備說服力的子圖
recurring:出現多次,高頻出現
significant:比預期更頻繁??

為什么我們需要motifs:
1. 幫助我們更好的認識網絡
2. 幫助我們更好的預測在給定場景下的網絡的操作與反應
例如:
feed-forward loops: 在神經元網絡中出現,應用於消除生物噪音?
parallel loops:食物網絡中
single-input modules:基因控制網

motifs:子圖的匹配與導出

motifs:重復出現   下圖中,左邊的網絡出現了4次左上角的子圖類型
子圖的意義: 現實網絡比 隨機網絡中出現得較多的子圖,具備功能的重要性
motif的重要意義:當網絡與隨機網絡比較時,motif可用於表征網絡



zi==motif i 的統計顯著性  (#(**)表示什么??)
網絡的顯著性 sp
 sp是一組正則化后的z-score的向量
 sp強調子圖的關聯顯著性:用於比較不同size網絡;一般來說,越大的網絡,z-score越高
  

Configuration Model:
目標:基於給定的度序列 k1,k2,...,kn 生成一個隨機圖
可用於比較具有相同度序列的隨機圖與真實圖
給定的輻射節點,隨機組隊,生成圖

Alternative for spokes: switching
選節點,交換邊的端點,多次重復??
一開始介紹motif時的那個圖


發現/檢測 motifs
1. 計數真實圖中的子圖
2. 統計隨機圖中的子圖 (可能有多個隨機圖)
3. 計算z-score
4. z-score越高的子圖,月可能是圖的motif

motif概念的變種:
規范定義:有向及無向;着色與未着色;變化與靜態
概念的變種:不同頻率概念;不同的顯著性度量;欠表征?;null model 的不同約束




Graphlets: node feature vectors   節點特征向量
Graphlets:連接的非同構子圖

graphlet的度向量
使用graphlet來獲取一個節點級別的子圖度量
graphlet degree vector 對一個節點接觸的graphlet的計數

automorphism orbit:自同構軌跡? 考慮子圖的對稱性
graphlet degree vector (GDV):

若只考慮2到5節點的graphlet,那么73維向量可以表示節點的鄰居拓撲,即最多捕捉4跳的距離
GDV是衡量節點局部網絡拓撲的工具,可用於比較兩個節點的相似度


Finding motifs and graphlets

尋找k-size的motifs或graphlet,需要解決兩個問題:
1. 枚舉所有樣式的size-k的連接子圖
2. 計數

但是,確定一個網絡中是否包含包含某一子圖,是難以計算的


圖同構:
圖G,H是同構的,那么存在一個雙射f:V(G)→V(H),使




網絡中的結構角色

角色有結構中的行為來衡量:
中心點,團的成員,外圍節點


結構等效節點:




探索網絡中的結構角色
角色查詢:識別相似個體
角色動態變化:識別行為變化
角色轉移:使用一個網絡中的已知來預測另一網絡
網絡比較:比較網絡相似性

RoIX: 在網絡洛自動發現節點角色
無監督學習,無需先驗知識,可發現節點的混合角色,邊數的先行拓展?
Recursive feature extraction :將網絡連接性轉化為解雇特征
neighborhood feature:節點的連接模式
recursive features:一個節點連接到什么類型的節點
local features:節點度的度量。若為有向圖,包含出度,入度,總度;若為帶權重的圖,則包含權重向量
egonet features:計算節點的egonet(自我網絡?)
    egonet包含:節點,鄰居,邊

此外,還增加平均和最大這兩個統計特征
RoIx:使用 non negative matrix factorization 用於聚類,MDL(最小描述長度?)用於模型選擇,KL散度用於相似度衡量

應用:結構相似度
將節點基於他們的結構相似度進行聚類:
  通過RoIx獲取節點的向量
  向量進行聚類
下圖是co-authorship的例子
藍色:連接緊密
紅色:橋梁節點,連接兩個group
灰色:大部分節點,不屬於團,也不屬於鏈
綠色:細長的聚類
購買網絡:紅色節點——中心,藍色——外圍








免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM