收集到幾種開源NLP工具


Apache OpenNLP庫是一個基於機器學習的自然語言文本處理的開發工具包,它支持自然語言處理中一些共有的任務,例如:標記化、句子分割、詞性標注、固有實體提取(指在句子中辨認出專有名詞,例如:人名)、淺層分析(句字分塊)、語法分析及指代。
http://opennlp.apache.org/index.html
 
 
FudanNLP主要是為中文自然語言處理而開發的工具包,也包含為實現這些任務的機器學習算法和數據集。FudanNLP及其包含數據集使用LGPL3.0許可證。
功能(Functions)
信息檢索: 文本分類 新聞聚類
中文處理: 中文分詞 詞性標注 實體名識別 關鍵詞抽取 依存句法分析 時間短語識別
結構化學習: 在線學習 層次分類 聚類 精確推理
 
LingPipe是一個自然語言處理的Java開源工具包。LingPipe目前已有很豐富的功能,包括主題分類(Top Classification)、命名實體識別(Named Entity Recognition)、詞性標注(Part-of Speech Tagging)、句題檢測(Sentence Detection)、查詢拼寫檢查(Query Spell Checking)、興趣短語檢測(Interseting Phrase Detection)、聚類(Clustering)、字符語言建模(Character Language Modeling)、醫學文獻下載/解析/索引(MEDLINE Download, Parsing and Indexing)、數據庫文本挖掘(Database Text Mining)、中文分詞(Chinese Word Segmentation)、情感分析(Sentiment Analysis)、語言辨別(Language Identification)等API。
 
語言技術平台(Language Technology Platform,LTP)是哈工大社會計算與信息檢索研究中心歷時十年開發的一整套中文語言處理系統。LTP制定了基於XML的語言處理結果表示,並在此基礎上提供了一整套自底向上的豐富而且高效的中文語言處理模塊(包括詞法、句法、語義等6項中文處理核心技術),以及基於動態鏈接庫(Dynamic Link Library, DLL)的應用程序接口,可視化工具,並且能夠以網絡服務(Web Service)的形式進行使用。
http://ir.hit.edu.cn/ltp/ 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM