【NLP中的BIO标注】


序列标注

序列标注是指对一段元素序列中的每一元素或部分元素进行标签标注的任务,对部分元素进行标签标注的任务又称作联合标注,而对每一元素都进行标签标注的任务称为原始标注。

BIO标注

BIO标注就是联合标注的一种,具体地B、I、O 分别表示Begin Inner Other

进一步地来说,B-X表示元素是X类型并且位于片段的起始位置,I-X表示元素是X类型并且位于元素片段的中间,O则表示元素不属于X类型。

示例:

B-NP 名词短语的起始位置

I-NP 名词短语的中间位置

O 不是名词短语

BIO标注可以用于命名实体识别中,假设我们将实体(人名、地名、组织、机构、时间)作为标签,可以得到:

B-NM

B-PLA

B-ORG等类型的标签


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM