spacy依存句法分析標簽


spacy依存句法分析的標簽一直不清楚,官方文檔也沒明確指出,這里整理了常見的依存標簽

計算機語言學家羅賓森總結了依存語法的四條定理:

1、一個句子中存在一個成分稱之為根(root),這個成分不依賴於其它成分。

2、其它成分直接依存於某一成分;

3、任何一個成分都不能依存與兩個或兩個以上的成分;

4、如果A成分直接依存於B成分,而C成分在句中位於A和B之間,那么C或者直接依存於B,或者直接依存於A和B之間的某一成分;

5、中心成分左右兩面的其它成分相互不發生關系。

使用斯坦福句法分析器做依存句法分析可以輸出句子的依存關系,Stanford parser基本上是一個詞匯化的概率上下文無關語法分析器,同時也使用了依存分析。

下面是對分析的結果中一些符號的解釋:

ROOT:要處理文本的語句;IP:簡單從句;NP:名詞短語;VP:動詞短語;PU:斷句符,通常是句號、問號、感嘆號等標點符號;LCP:方位詞短語;PP:介詞短語;CP:由‘的’構成的表示修飾性關系的短語;DNP:由‘的’構成的表示所屬關系的短語;ADVP:副詞短語;ADJP:形容詞短語;DP:限定詞短語;QP:量詞短語;NN:常用名詞;NR:固有名詞;NT:

ROOT:要處理文本的語句

IP:簡單從句

NP:名詞短語

VP:動詞短語

PU:斷句符,通常是句號、問號、感嘆號等標點符號

LCP:方位詞短語

PP:介詞短語

CP:由‘的’構成的表示修飾性關系的短語

DNP:由‘的’構成的表示所屬關系的短語

ADVP:副詞短語

ADJP:形容詞短語

DP:限定詞短語

QP:量詞短語

NN:常用名詞

NR:固有名詞

NT:時間名詞

PN:代詞

VV:動詞

VC:是

CC:表示連詞

VE:有

VA:表語形容詞

AS:內容標記(如:了)

VRD:動補復合詞

CD: 表示基數詞

DT: determiner 表示限定詞

EX: existential there 存在句

FW: foreign word 外來詞

IN: preposition or conjunction, subordinating 介詞或從屬連詞

JJ: adjective or numeral, ordinal 形容詞或序數詞

JJR: adjective, comparative 形容詞比較級

JJS: adjective, superlative 形容詞最高級

LS: list item marker 列表標識

MD: modal auxiliary 情態助動詞

PDT: pre-determiner 前位限定詞

POS: genitive marker 所有格標記

PRP: pronoun, personal 人稱代詞

RB: adverb 副詞

RBR: adverb, comparative 副詞比較級

RBS: adverb, superlative 副詞最高級

RP: particle 小品詞

SYM: symbol 符號

TO:”to” as preposition or infinitive marker 作為介詞或不定式標記

WDT: WH-determiner WH限定詞

WP: WH-pronoun WH代詞

WP$: WH-pronoun, possessive WH所有格代詞

WRB:Wh-adverb WH副詞

關系表示 (token.dep_)

abbrev: abbreviation modifier,縮寫

acomp: adjectival complement,形容詞的補充;

advcl : adverbial clause modifier,狀語從句修飾詞

advmod: adverbial modifier狀語

agent: agent,代理,一般有by的時候會出現這個

amod: adjectival modifier形容詞

appos: appositional modifier,同位詞

attr: attributive,屬性

aux: auxiliary,非主要動詞和助詞,如BE,HAVE SHOULD/COULD等到

auxpass: passive auxiliary 被動詞

cc: coordination,並列關系,一般取第一個詞

ccomp: clausal complement從句補充

complm: complementizer,引導從句的詞好重聚中的主要動詞

conj : conjunct,連接兩個並列的詞。

cop: copula。系動詞(如be,seem,appear等),(命題主詞與謂詞間的)連系

csubj : clausal subject,從主關系

csubjpass: clausal passive subject 主從被動關系

dep: dependent依賴關系

det: determiner決定詞,如冠詞等

dobj : direct object直接賓語

expl: expletive,主要是抓取there

infmod: infinitival modifier,動詞不定式

iobj : indirect object,非直接賓語,也就是所以的間接賓語;

mark: marker,主要出現在有“that” or “whether”“because”, “when”,

mwe: multi-word expression,多個詞的表示

neg: negation modifier否定詞

nn: noun compound modifier名詞組合形式

npadvmod: noun phrase as adverbial modifier名詞作狀語

nsubj : nominal subject,名詞主語

nsubjpass: passive nominal subject,被動的名詞主語

num: numeric modifier,數值修飾

number: element of compound number,組合數字

parataxis: parataxis: parataxis,並列關系

partmod: participial modifier動詞形式的修飾

pcomp: prepositional complement,介詞補充

pobj : object of a preposition,介詞的賓語

poss: possession modifier,所有形式,所有格,所屬

possessive: possessive modifier,這個表示所有者和那個’S的關系

preconj : preconjunct,常常是出現在 “either”, “both”, “neither”的情況下

predet: predeterminer,前綴決定,常常是表示所有

prep: prepositional modifier

prepc: prepositional clausal modifier

prt: phrasal verb particle,動詞短語

punct: punctuation,這個很少見,但是保留下來了,結果當中不會出現這個

purpcl : purpose clause modifier,目的從句

quantmod: quantifier phrase modifier,數量短語

rcmod: relative clause modifier相關關系

ref : referent,指示物,指代

rel : relative

root: root,最重要的詞,從它開始,根節點

tmod: temporal modifier

xcomp: open clausal complement

xsubj : controlling subject 掌控者

中心語為謂詞

subj — 主語

nsubj — 名詞性主語(nominal subject) (同步,建設)

top — 主題(topic) (是,建築)

npsubj — 被動型主語(nominal passive subject),專指由“被”引導的被動句中的主語,一般是謂詞語義上的受事 (稱作,鎳)

csubj — 從句主語(clausal subject),中文不存在

xsubj — x主語,一般是一個主語下面含多個從句 (完善,有些)

中心語為謂詞或介詞

obj — 賓語

dobj — 直接賓語 (頒布,文件)

iobj — 間接賓語(indirect object),基本不存在

range — 間接賓語為數量詞,又稱為與格 (成交,元)

pobj — 介詞賓語 (根據,要求)

lobj — 時間介詞 (來,近年)

中心語為謂詞

comp — 補語

ccomp — 從句補語,一般由兩個動詞構成,中心語引導后一個動詞所在的從句(IP) (出現,納入)

xcomp — x從句補語(xclausal complement),不存在

acomp — 形容詞補語(adjectival complement)

tcomp — 時間補語(temporal complement) (遇到,以前)

lccomp — 位置補語(localizer complement) (占,以上)

— 結果補語(resultative complement)

中心語為名詞

mod — 修飾語(modifier)

pass — 被動修飾(passive)

tmod — 時間修飾(temporal modifier)

rcmod — 關系從句修飾(relative clause modifier) (問題,遇到)

numod — 數量修飾(numeric modifier) (規定,若干)

ornmod — 序數修飾(numeric modifier)

clf — 類別修飾(classifier modifier) (文件,件)

nmod — 復合名詞修飾(noun compound modifier) (浦東,上海) amod — 形容詞修飾(adjetive modifier) (情況,新)

advmod — 副詞修飾(adverbial modifier) (做到,基本)

vmod — 動詞修飾(verb modifier,participle modifier)

prnmod — 插入詞修飾(parenthetical modifier)

neg — 不定修飾(negative modifier) (遇到,不)

det — 限定詞修飾(determiner modifier) (活動,這些) possm — 所屬標記(possessive marker),NP

poss — 所屬修飾(possessive modifier),NP

dvpm — DVP標記(dvp marker),DVP (簡單,的)

dvpmod — DVP修飾(dvp modifier),DVP (采取,簡單)

assm — 關聯標記(associative marker),DNP (開發,的)

assmod — 關聯修飾(associative modifier),NP|QP (教訓,特區) prep — 介詞修飾(prepositional modifier) NP|VP|IP(采取,對) clmod — 從句修飾(clause modifier) (因為,開始)

plmod — 介詞性地點修飾(prepositional localizer modifier) (在,上) asp — 時態標詞(aspect marker) (做到,了)

partmod– 分詞修飾(participial modifier) 不存在

etc — 等關系(etc) (辦法,等)

中心語為實詞

conj — 聯合(conjunct)

cop — 系動(copula) 雙指助動詞????

cc — 連接(coordination),指中心詞與連詞 (開發,與)

其它

attr — 屬性關系 (是,工程)

cordmod– 並列聯合動詞(coordinated verb compound) (頒布,實行) mmod — 情態動詞(modal verb) (得到,能)

ba — 把字關系

tclaus — 時間從句 (以后,積累)

— semantic dependent

cpm — 補語化成分(complementizer),一般指“的”引導的CP (振興,的)

詞性標注(token.tag_)

依據:Penn Treebank詞性標記集
編號 縮寫 英文 中文
1 CC Coordinating conjunction 並列連接詞
2 CD Cardinal number 基數
3 DT Determiner 限定詞
4 EX Existential there 存在型there
5 FW Foreign word 外文單詞
6 IN Preposition/subord, conjunction 介詞/從屬,連接詞
7 JJ Adjective 形容詞
8 JJR Adjective, comparative 形容詞,比較級
9 JJS Adjective, superlative 形容詞,最高級
10 LS List item marker 列表項標記
11 MD Modal 情態動詞
12 NN Noun ,singular or mass 名詞,可數或不可數
13 NNS Noun, plural 名詞,復數
14 NNP Proper noun, singular 專有名詞,單數
15 NNPS Proper noun, plural 專有名詞,復數
16 PDT Predeterminer 前位限定詞
17 POS Possessive ending 所有格結束詞
18 PRP Personal pronoun 人稱代名詞
20 RB Adverb 副詞
21 RBR Adverb, comparative 副詞,比較級
22 RBS Adverb, superlative 副詞,最高級
23 RP Particle 小品詞
24 SYM Symbol(mathematical or scientific) 符號(數學或科學)
25 TO to To
26 UH Interjection 感嘆詞
27 VB Verb, base form 動詞,基本形態
28 VBD Verb, past tense 動詞,過去式
29 VBG Verb, gerund/present participle 動詞,動名詞/現在分詞
30 VBN Verb, past participle 動詞,過去分詞
31 VBP Verb, non-3rd ps. sing. Present 動詞,非第三人稱單數現在式
32 VBZ Verb, 3rd ps. sing. Present 動詞,第三人稱單數現在式
33 WDT wh-determiner wh-限定詞
34 WP wh-pronoun wh-代詞
35 WP$ Possessive wh-pronoun 所有格wh-代詞
36 WRB wh-adverb wh-副詞
37 # Pound sign #符號
38 $ Dollar sign 美元符號
39 . Sentence-final punctuation 句點
40 , Comma 逗號
41 : Colon, semi-colon 冒號,分號
42 ( Left bracket character 左括號
43 ) Right bracket character 右括號
44 “ Straight double quote 雙引號
45 ‘ Left open single quote 左單引號
46 “ Left open double quote 左雙引號
47 ’ Right close single quote 右單引號
48 ” Right close double quote 右雙引號
轉載自:https://blog.csdn.net/lihaitao000/article/details/51812618
https://blog.csdn.net/u010099495/article/details/46776617
https://github.com/clir/clearnlp-guidelines/blob/master/md/specifications/dependency_labels.md
https://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM