Temporal Link Prediction: A Survey時間鏈路預測綜述


Keywords:Dynamic networks · Temporal networks · Link prediction

1 介紹

下圖表示時變網絡的三種常見表示,它們有助於捕獲網絡的動態

  • 快照:網絡被表示為一系列靜態網絡,每一步一個。
  • 接觸序列:如果交互持續時間可以忽略不計,則將網絡表示為三個一組(i, j, t),其中i和j為實體,t為交互時間。
  • 區間圖:若交互持續時間不可忽略,T(e)={(t1, t1 1),…,(tn,t n)},邊緣e處於活動狀態。

 

 

 2 背景

2.1 靜態網絡的鏈路預測

大多數算法都是將靜態網絡在特定時間段內進行預測,從而忽略了網絡的時間特性。在靜態網絡中,鏈路預測是對網絡中某一時刻缺少的鏈路進行預測,以獲得網絡的全貌。

2.2 Temporal Link Prediction: Problem Definition時間鏈路預測定義

讓G = (V, E)是一個動態的網絡,V是頂點的集合和每條邊(u, V)휖E代表u和V之間的聯系的快照G表示為G1, G2,……從時間步驟1到t,我們如何預測下一個時間步驟Gt+1的網絡

 

 

 

2.3 時間鏈路預測的評估指標

(1)Area under curve(AUC):AUC 被廣泛的用來作為鏈路預測評估指標。這個度量可以解釋為隨機選擇的缺失鏈路比隨機選擇的不存在的鏈路獲得更高的分數的概率,前提是所有未觀察到的鏈路的排名。此度量的值在 0 和 1 之間。在 n 個獨立比較中,如果缺失的鏈接有 n′ 得分較高,n′′相同,則 AUC 得分計算如下:
 
(2)Mean average precision(MAP):此度量是平均精度(AP)的擴展,其中計算所有 AP 的平均值以獲得MAP 分數。它估計每個節點的精度並計算所有節點的平均值。計算如下:
(3)Area under precision recall(AUPR):AUPR 與召回反精確性密謀。它被認為是解決不平衡分類問題的一種更為相關的措施。
(4) F1-score:F1-score (F-score or F-measure) 是測試准確性的衡量標准。它同時考慮了測試的精確度和召回率來計算分數。該指標計算如下:

 3 時間鏈路預測技術

(1)矩陣分解(Matrix Factorization)

大致步驟:
  • 動態網絡以矩陣形式表示(例如:鄰接矩陣);
  • 各種低階近似算法被用來表征和提取動態網絡的基本特征;
  • 引入了幾個參數以有效地捕獲時間信息和網絡屬性;
  • 執行基於潛在特征的獲得的時間鏈路預測。

 (2)概率方法(Probabilistic Approaches) 

大致步驟:
  • 動態網絡表示為定期間隔的快照序列;
  • 最大似然方法或概率分布(如聯合概率分布,伯納利分布等)用於推斷未來鏈接的可能性。

 (3)光譜聚類(Spectral Clustering)

大致步驟:
  • 動態網絡以拉普拉斯矩陣的形式表示為一系列快照;
  • 圖譜和圖拉普拉斯圖的低秩逼近形成了鏈路預測的基本特征;
  • 時間序列預測模型和線性系統模型等幾種模型用於預測未來時間的特征向量;
  • 執行基於預測的特征向量執行鏈路預測。

 (4)時間序列(Time Series)

大致步驟:
  • 動態網絡表示為不同時間段的快照序列;
  • 對於網絡中的每對節點,都基於各種節點相似性度量來構建時間序列;
  • 使用時間序列預測模型以預測未來時間段的時間序列得分;
  • 執行基於預測分數執行鏈路預測。

 

(5)深度學習(Deep learning)

(5.1) 基於嵌入的時態鏈路預測(Embedding‑Based Temporal Link Prediction) 
 
大致步驟:
  • 為了捕獲時間方面,將動態網絡表示為快照序列或聯系序列或間隔圖;
  • 通過保留所有網絡屬性,使用各種基於深度學習的技術以將網絡嵌入到低維向量空間中;
  • 可以預測未來一段時間的嵌入情況,從而確定該時間的網絡結構;
  • 執行基於預測嵌入的時間鏈路預測。

 

(5.2) 基於受限玻爾茲曼機(RBM)(Restricted Boltzmann Machine (RBM) Based) 

大致步驟:
  • 動態網絡以固定間隔的快照序列表示;
  • 基於對動態網絡結構的觀察序列,可以對結合了時間和鄰近信息的 RBM 模型進行訓練;
  • 計算鄰居連接的概率以執行時間鏈路預測。 

 

 

(6) 其他方法

4、未來方向

矩陣分解技術結合了動態網絡的線性特征。 為了提高預測精度,可以進行進一步的改進以考慮時間網絡的非線性變化的復雜模式。 大多數概率方法采用最大似然方法。 與費時的最大似然方法相反,概率多層模型可以擴展為包含無向動態網絡。 與其使用像FIR濾波器之類的單一線性系統模型,不如擴展基於頻譜聚類的技術來部署分布式濾波器以捕獲不同用戶的潛在特征,這將更好。 時間序列可以有效地捕獲網絡的演變模式。 但是,計算保留所有網絡屬性的時間序列分數仍然是一項艱巨的任務。 此外,傳統的時間序列預測技術無法捕獲網絡的非耳式變化時間模式。 因此,通過結合網絡的非線性變化的時間模式來預測未來分數的有效時間序列預測方法可以提高時間鏈路預測的准確性。 嵌入技術通過保留所有網絡屬性,在將網絡映射到低維空間中表現出出色的性能。 從嵌入中構造的時間序列得分將有效地捕獲網絡的不斷發展的本質。 此外,在此時間序列上部署有效的時間序列預測模型將提高時間鏈接預測的准確性。

本文討論的時間鏈路預測技術是在網絡中的節點在所有時間段內保持相同的假設下進行的。 但是,在現實世界的異構網絡中,節點和邊都隨時間增加或刪除。 如何擴展時間鏈路預測技術以合並異構網絡仍然是一個懸而未決的問題。 此外,絕大多數現實世界網絡都與一組豐富的節點屬性相關聯,並且它們的屬性值也有所不同。 擴展時間鏈路預測以合並歸因網絡將是未來的一項有前途的任務。 可以在現有系統中進行進一步的改進以減少計算復雜度,從而提高性能。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM