安裝
系統需要安裝Java1.6+
http://nlp.stanford.edu/software/tagger.shtml
下載Download full Stanford Tagger version 3.3.1 [155 MB]
使用說明
標注器有三個模式:標注、訓練、測試
這里我們用已經訓練好的標注模型, 對於中文有兩個(model目錄下)
- chinese-distsim.tagger(性能比較好)
- chinese-nodistsim.tagger
二者區別
使用
java -mx300m -classpath stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger -model models/chinese-distsim.tagger -textFile inputFile > outputFile java -mx300m -classpath stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger -model models/chinese-nodistsim.tagger -textFile inputFile > outputFile
案例
輸入文件:del
今天 天氣 相當 不錯. 今天 是 個 好 日子.
命令
java -mx300m -classpath stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger -model models/chinese-distsim.tagger -textFile del > delout
輸出文件:delout