WordNet是面向語義的英語詞典,類似於傳統字典。它是NLTK語料庫的一部分,可以被這樣調用:
更簡潔的寫法:
1.單詞
查看一個單詞的同義詞集用synsets(); 它有一個參數pos,可以指定查找的詞性。這里得到的同義詞集是同義詞集的集合,即里面不是單純的詞,是同義詞的集合.
注:
- 一個synset(同義詞集:指意義相同的詞條的集合)被一個三元組描述:(單詞.詞性.序號)。這里的’dog.n.01’指:dog的第一個名詞意思;’chase.v.01’指:chase的第一個動詞意思
- pos可為:NOUN、VERB、ADJ、ADV…
2.同義詞集
注:一些關系的獲得只能通過Lemmas,比如反義詞:
3. Similarity
synset1.path_similarity(synset2): 是基於上位詞層次結構中相互連接的概念之間的最短路徑在0-1范圍的打分(兩者之間沒有路徑就返回-1)。同義詞集與自身比較將返回1
參考:
http://nltk.googlecode.com/svn/trunk/doc/howto/wordnet.html
python 自然語言處理