大家都知道TreeTagger是一個用於詞性標注和詞型還原的工具,它的返回結果由三部分組成:目標詞匯,詞性,原形。那該工具是怎樣判斷目標詞匯的詞性的呢 又是怎樣得到目標詞匯的原形的呢 本文就是從這兩個問題入手,對TreeTagger的原理進行簡單的介紹。 . 詞性的識別判斷 這里詞性的識別采用的決策樹分類方法。如下圖所示,首先將目標文本分成三元短語,然后通過判斷目標詞匯的前兩個單詞的詞性來判斷當前 ...
2017-06-27 17:02 1 3139 推薦指數:
查看詳情