stanford-postagger中文詞性標注


安裝

系統需要安裝Java1.6+

http://nlp.stanford.edu/software/tagger.shtml 

下載Download full Stanford Tagger version 3.3.1 [155 MB]

 

使用說明

標注器有三個模式:標注、訓練、測試

這里我們用已經訓練好的標注模型, 對於中文有兩個(model目錄下)

  • chinese-distsim.tagger(性能比較好)
  • chinese-nodistsim.tagger

二者區別

 

 

使用

java -mx300m -classpath stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger -model models/chinese-distsim.tagger -textFile inputFile > outputFile

java -mx300m -classpath stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger -model models/chinese-nodistsim.tagger -textFile inputFile > outputFile

  

案例

輸入文件:del

今天 天氣 相當 不錯.
今天 是 個 好 日子.

命令

java -mx300m -classpath stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger -model models/chinese-distsim.tagger -textFile del > delout

輸出文件:delout

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM