nltk.stem 詞干提取(stemming)


鏈接:nltk.stem 詞干提取(stemming)

Stemming 可以抽取詞的詞干或詞根形式,NLTK中提供了三種最常用的詞干提取器接口

'''基於Porter詞干提取算法'''

from nltk.stem.porter import PorterStemmer

porter_stemmer = PorterStemmer()
porter_stemmer.stem(‘multiply’)  #  u’multipli’

''' 基於Lancaster 詞干提取算法  '''

from nltk.stem.lancaster import LancasterStemmer

lancaster_stemmer = LancasterStemmer()
lancaster_stemmer.stem(‘multiply’)      #  ‘multiply’ 

'''基於Snowball 詞干提取算法   ''''

from nltk.stem import SnowballStemmer

snowball_stemmer = SnowballStemmer(“english”)
snowball_stemmer.stem(‘multiply’)   #  u’multipli’

老師要求第一種,porter stemming

后續跟進。。。。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM