Stemming 可以抽取詞的詞干或詞根形式,NLTK中提供了三種最常用的詞干提取器接口
'''基於Porter詞干提取算法''' from nltk.stem.porter import PorterStemmer porter_stemmer = PorterStemmer() porter_stemmer.stem(‘multiply’) # u’multipli’ ''' 基於Lancaster 詞干提取算法 ''' from nltk.stem.lancaster import LancasterStemmer lancaster_stemmer = LancasterStemmer() lancaster_stemmer.stem(‘multiply’) # ‘multiply’ '''基於Snowball 詞干提取算法 '''' from nltk.stem import SnowballStemmer snowball_stemmer = SnowballStemmer(“english”) snowball_stemmer.stem(‘multiply’) # u’multipli’
老師要求第一種,porter stemming
后續跟進。。。。