開放領域關系抽取文獻綜述


 

關系抽取分類:

(一)限定域關系抽取

  1. pipeline方式,先做實體識別再接關系分類任務
  2. 實體識別+關系分類聯合模型
  3. 遠程監督關系抽取(利用圖譜三元組回標語料)

(二)開放領域關系抽取

  1.基於語法規則+依存句法分析樹

A Syntax-based System for Chinese Open Relation Extraction

Chinese Open Relation Extraction and Knowledge Base Establishment,

  2.半監督bootstrap迭代式抽取

Open Language Learning for Information Extraction

  3.基於序列標注神經網絡模型

Supervised Open Information extraction

Hybrid Neural Tagging Model for Open Relation Extraction

 

這里重點介紹基於序列標注的模型

 

Supervised Open Information extraction

  1. 將開放關系抽取視為一個序列標注任務
  2. QA-SRL問答語義角色標注任務中構建出訓練集

數據格式:

 

 

 

 

 

 

 

 模型結構:

 

 

 

輸入融合了謂詞的特征

 

 

 

 

 

預測結果累乘積作為三元組的置信度

 

 

 

Hybrid Neural Tagging Model for Open Relation Extraction

  1. OIE當成序列標注任務,提出一種自動構建訓練數據的方法(多個已有的開源OIE系統的抽取結果,取置信度較高的結果)
  2. 提出一種混合的神經網絡模型來進行實體及關系的抽取
  3. 實現雙重感知機制(局部的Attention和全局的卷積)

 

可重疊的標注體系(同一個詞可以有不同標簽)

 

 

 

 

 模型結構:

 

 

 

 

 

 

 

 Local-aware Attention

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM