**********************原文 https://blog.csdn.net/weixin_44526949/article/details/102318261 ************************
构建知识图谱的过程,就是信息抽取+知识融合+知识加工三个过程,
1 信息抽取设计的关键技术为 实体抽取+关系抽取+属性抽取
1.1 实体抽取 -----named entity recongnition 实体抽取的P R 对后续的知识获取效率和质量影响极大
关系抽取的具体实现方式,主要有pipeline和end2end方法
1 pipeline方法
管道式方法,主要就是将关系抽取拆分为两个步骤,实体抽取+关系识别 2个主要的步骤,因为这个过程是串联起来的,所以称之为pipeline方法。
整个过程大致是这样的,输入一条文本,先用实体识别抽取器识别出其中的各个实体。然后对抽取出来的实体每两个组合进行组合在加上原文本句子作为关系识别器的输入进行两输入实体间的关系识别。
2 end2end方法
端到端的识别抽取方法,或称之为联合抽取方法。只输入一个句子,然后从中抽取出实体关系的三元组。