關系抽取:
- 將無結構化信息轉化為結構化信息存儲在知識庫中
- 抽取出格式統一的實體關系便於海量數據處理
- 將分析出的多個實體語義關系和實體關聯,促進知識庫自動構建
- 對用戶查詢意圖理解分析,提高檢索效率
ACE關系抽取定義
實體關系定義的是實體之間顯式或隱式的語義聯系。
因此需要預先定義實體關系類型
然后識別實體之間是否存在語義關系
進而判定屬於哪種預定義的關系類別。
關系通常指代文本中實體之間的聯系,
語法關系、語義關系,
形式化描述為三元組<E1, R, E2>.
實體關系抽取主要目的:從自然語言文本中識別並判定實體對之間存在的特定關系。
1文本經過NER,關系觸發詞識別兩個預處理過程
人名地名機構名專有名詞
對判定觸發實體關系的詞進行分類,判斷是否是關系觸發詞,判定是正類還是負類
2關系抽取模型判定從識別出的實體中抽取實體間的語義關系