關系抽取分類:
(一)限定域關系抽取
- pipeline方式,先做實體識別再接關系分類任務
- 實體識別+關系分類聯合模型
- 遠程監督關系抽取(利用圖譜三元組回標語料)
(二)開放領域關系抽取
1.基於語法規則+依存句法分析樹
A Syntax-based System for Chinese Open Relation Extraction
Chinese Open Relation Extraction and Knowledge Base Establishment,
2.半監督bootstrap迭代式抽取
Open Language Learning for Information Extraction
3.基於序列標注神經網絡模型
Supervised Open Information extraction
Hybrid Neural Tagging Model for Open Relation Extraction
這里重點介紹基於序列標注的模型
Supervised Open Information extraction
- 將開放關系抽取視為一個序列標注任務
- 從QA-SRL問答語義角色標注任務中構建出訓練集
數據格式:
模型結構:
輸入融合了謂詞的特征
預測結果累乘積作為三元組的置信度
Hybrid Neural Tagging Model for Open Relation Extraction
- 將OIE當成序列標注任務,提出一種自動構建訓練數據的方法(多個已有的開源OIE系統的抽取結果,取置信度較高的結果)
- 提出一種混合的神經網絡模型來進行實體及關系的抽取
- 實現雙重感知機制(局部的Attention和全局的卷積)
可重疊的標注體系(同一個詞可以有不同標簽)
模型結構:
Local-aware Attention