原文:開源中文分詞工具探析(六):Stanford CoreNLP

CoreNLP是由斯坦福大學開源的一套Java NLP工具,提供諸如:詞性標注 part of speech POS tagger 命名實體識別 named entity recognizer NER 情感分析 sentiment analysis 等功能。 開源中文分詞工具探析 系列: 開源中文分詞工具探析 一 :ICTCLAS NLPIR 開源中文分詞工具探析 二 :Jieba 開源中文分詞工 ...

2018-02-07 21:24 0 11430 推薦指數:

查看詳情

開源中文分詞工具探析(五):FNLP

FNLP是由Fudan NLP實驗室的邱錫鵬老師開源的一套Java寫就的中文NLP工具包,提供諸如分詞、詞性標注、文本分類、依存句法分析等功能。 【開源中文分詞工具探析】系列: 開源中文分詞工具探析(一):ICTCLAS (NLPIR) 開源中文分詞工具探析(二):Jieba ...

Thu Mar 16 22:29:00 CST 2017 5 4979
開源中文分詞工具探析(三):Ansj

Ansj是由孫健(ansjsun)開源的一個中文分詞器,為ICTLAS的Java版本,也采用了Bigram + HMM分詞模型(可參考我之前寫的文章):在Bigram分詞的基礎上,識別未登錄詞,以提高分詞准確度。雖然基本分詞原理與ICTLAS的一樣,但是Ansj做了一些工程上的優化,比如:用DAT ...

Thu Jan 12 03:21:00 CST 2017 3 11409
開源中文分詞工具探析(四):THULAC

THULAC是一款相當不錯的中文分詞工具,准確率高、分詞速度蠻快的;並且在工程上做了很多優化,比如:用DAT存儲訓練特征(壓縮訓練模型),加入了標點符號的特征(提高分詞准確率)等。 【開源中文分詞工具探析】系列: 開源中文分詞工具探析(一):ICTCLAS (NLPIR) 開源 ...

Wed Feb 22 23:57:00 CST 2017 0 4594
開源中文分詞工具探析(七):LTP

LTP是哈工大開源的一套中文語言處理系統,涵蓋了基本功能:分詞、詞性標注、命名實體識別、依存句法分析、語義角色標注、語義依存分析等。 【開源中文分詞工具探析】系列: 開源中文分詞工具探析(一):ICTCLAS (NLPIR) 開源中文分詞工具探析(二):Jieba 開源中文 ...

Tue Jun 12 00:52:00 CST 2018 1 3573
stanford corenlp的TokensRegex

最近做一些音樂類、讀物類的自然語言理解,就調研使用了下Stanford corenlp,記錄下來。 功能 Stanford Corenlp是一套自然語言分析工具集包括: POS(part of speech tagger)-標注詞性 NER(named entity ...

Fri Aug 05 23:59:00 CST 2016 0 3075
Stanford CoreNLP--功能列表

Standford CoreNLP包含很多功能,github上有源碼,github地址:Stanford CoreNLP,有需要的話可以下載看看。 主要內容在網站上都有描述,原文是這樣寫的: Choose Stanford CoreNLP if you need ...

Fri May 06 19:13:00 CST 2016 0 3059
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM