rescal閱讀


基於三向張量分解(factorization of a three-way tensor)的關系學習方法

我們的方法與其他張量方法不同,我們的方法能夠可以通過模型的潛在組件進行集體學習並提供一種計算分解的有效的算法。

我們證實我們關於模型集體學習能力的理論考慮通過在新數據集和實體解析中常用的數據集上進行實驗的方法。

relational learning

collective learning

entity resolution

1、介紹

隨着關系數據和網絡數據在社交網絡建模,語義網,生物信息學和人工智能等不同領域的日益增長的相關性,關系學習領域的重要性日益增加。 本文關注張量在關系學習中的應用。 張量及其分解廣泛用於心理學或化學計量學等領域,並且最近也已應用於數據挖掘和機器學習問題,例如用於對社交網絡中的時間效應進行建模。 在關系學習中,張量(tensors)用於替代更常見的方法,如圖形模型(graphical models)。

從建模的角度來說,張量提供了簡單性,因為任何順序的多個關系可以被直接表示為更高階的張量。此外,不需要知道或從數據中,推理出關於問題結構的先驗知識,但這對於圖形模型,比如貝葉斯網絡或馬爾可夫邏輯網絡(MLN)是必要的。從學習的角度應用張量分解的原因是關系領域通常是高維度和稀疏的,分解方法(factorization)展示出了非常好的結果。

關系數據的一個重要特性是可以在多個互連節點之間產生相關性。

可以通過在學習任務中包括相關實體的屬性,關系或類來捕獲這些相關性。

但是,眾所周知的張量分解方法比如CP/Tucker不能有效的對集體學習效果進行建模。

我們提出了基於張量分解的關系學習方法RESCAL,該方法與DEDICOM有關但是丟棄了DEDICOM中的限制,因此我們可以生成高質量的模型並且顯著減少運行時間。

我們會展示一種計算分解的有效的算法,並且在一個新的集體學習數據集和關系學習基本數據集上評估我們的模型。與關系學習中最好的方法相比,我們的方法可以達到更好或者相似的結果,但只用了一小部分時間來計算。

2、建模和符號

dyadic relational data(二元關系數據)表示兩個物件直接的關系

我們用三元組的形式表示二元關系數據,預測既可以是兩個實體之間也可以是實體和屬性值之間的關系。我們通過三向張量將二元關系數據表示為張量,其中兩維為實體,第三維表示關系。X(i,j,k)==1表示三元組(i,k,j)存在,否則表示不存在或未知的關系。

4、方法和理論

Relational learning is concerned with domains where entities are interconnected by multiple relations.(關系學習涉及實體被多個關系相互連接的領域)

(副總統,黨派,a)------->(總統,黨派,。。)  已知總統黨派和副總統黨派大概率相同

集體分類(collective classification)指包含諸如屬性、類或連接實體的關系等信息來支持一個分類任務。然而這個過程不僅在分類問題中是有用的,在實體解析(entity resolution)、連接預測(link prediction)或者其他在關系數據上的學習任務都是有用的。

 4.1、多關系數據的模型

為了執行在多關系數據上的集體學習,我們提出了RESCAL方法,一種使用了張量分解模型的方法,考慮了關系數據的內在結構。更精確的,我們使用了rank-r分解,


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM