NLPIR簡介及使用配置


 

  NLPIR漢語分詞系統(又名ICTCLAS2013),主要功能包括中文分詞;詞性標注;命名實體識別;用戶詞典功能;支持GBK編碼、UTF8編碼、BIG5編碼。新增微博分詞、新詞發現與關鍵詞提取;

官方網址:http://ictclas.nlpir.org(地址一直在變,要是不能用直接搜NLPIR)

大數據論壇:http://www.bigdatabbs.com/forum.php?mod=forumdisplay&fid=64

資源下載

要是直接從官網下載最新版本,會一直配置出錯,我已經整合了可用的資源,分享在網盤:http://pan.baidu.com/s/1c0hLarm

下載之后,在eclipse里面創建工程並且按照以下結構來搭建:

 

注意要點:

1 直接把kevin文件夾復制到src文件夾,使它成為如上所示的包結構;

2 file文件夾里面放着數據,比如詞典,很多init錯誤都是因為這個文件夾的原因;

3 NLPIR_JNI.dll和NLPIR.dll放在根目錄下。

 

測試代碼:

 1 import java.io.UnsupportedEncodingException;
 2 
 3 import kevin.zhang.NLPIR;
 4 
 5 public class Init {
 6     public static void main(String[] args) throws UnsupportedEncodingException {
 7     NLPIR testNLPIR = new NLPIR();
 8     String argu = "./file/";
 9     System.out.println("NLPIR_Init...");
10     if (testNLPIR.NLPIR_Init(argu.getBytes("GB2312"), 0) == false) {
11         System.out.println("Init Fail!..");
12         return;
13     }
14     System.out.println("NLPIR_Success...");
15     testNLPIR.NLPIR_Exit();
16     }
17 }

看到下面的輸出則表示eclipse工程已經成功配置

1 NLPIR_Init...
2 NLPIR_Success...

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM