1秒登录
大家都知道TreeTagger是一个用于词性标注和词型还原的工具,它的返回结果由三部分组成:目标词汇,词性,原形。那该工具是怎样判断目标词汇的词性的呢 又是怎样得到目标词汇的原形的呢 本文就是从这两个问题入手,对TreeTagger的原理进行简单的介绍。 . 词性的识别判断 这里词性的识别采用的决策树分类方法。如下图所示,首先将目标文本分成三元短语,然后通过判断目标词汇的前两个单词的词性来判断当前 ...
2017-06-27 17:02 1 3139 推荐指数:
查看详情