【NLP中的BIO標注】


序列標注

序列標注是指對一段元素序列中的每一元素或部分元素進行標簽標注的任務,對部分元素進行標簽標注的任務又稱作聯合標注,而對每一元素都進行標簽標注的任務稱為原始標注。

BIO標注

BIO標注就是聯合標注的一種,具體地B、I、O 分別表示Begin Inner Other

進一步地來說,B-X表示元素是X類型並且位於片段的起始位置,I-X表示元素是X類型並且位於元素片段的中間,O則表示元素不屬於X類型。

示例:

B-NP 名詞短語的起始位置

I-NP 名詞短語的中間位置

O 不是名詞短語

BIO標注可以用於命名實體識別中,假設我們將實體(人名、地名、組織、機構、時間)作為標簽,可以得到:

B-NM

B-PLA

B-ORG等類型的標簽


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM