**第一步**:在復制下列代碼到您的編程軟件項目里之前,還需要下載兩個jar包
**IKAnalyzer2012.jar
lucene-core-3.6.0.jar**
百度網盤下載地址
https://pan.baidu.com/s/1oGec_mqU7PdqkKdA-H4k0Q
提取碼: 9egm
**第二步**:將兩個jar包復制到任意一個文件中(或者你可以新建一個lib文件夾然后把兩個文件復制進去)
**第三步**:右擊項目出現如下頁面,再點擊Build Path下的Configure Build path...
**第四步**:第三步之后頁面會跳出如下窗口,點擊Add jaRs....:
**第五步**:然后找到你復制進項目中的兩個jar包,按Ctrl鍵可以同時選中兩個一起添加
**第六步**:添加后的樣子如下所示,文件圖標變成小奶瓶,最后點擊Apply應用就可以復制代碼運行了。
**第七步**:復制代碼到你的clss文件中運行即可
package com.core.service.impl;(這里改成自己的包名) import java.io.IOException; import java.io.StringReader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.TokenStream; import org.apache.lucene.analysis.tokenattributes.CharTermAttribute; import org.wltea.analyzer.lucene.IKAnalyzer; public class ChineseWordSeg { public static void main(String[] args) throws IOException { // 提前准備需要分詞的語言 String t = "你好,我現在還剛剛接觸數據結構,所以還不是太了解!"; // 創建一個分詞對象 Analyzer a = new IKAnalyzer(true); StringReader r = new StringReader(t); // 對讀入的語言開始進行分詞操作 TokenStream to = a.tokenStream("", r); // 獲得CharTermAttribute類 CharTermAttribute te = to.getAttribute(CharTermAttribute.class); // 依次遍歷分詞數據,注意要轉換成字符串類型 while (to.incrementToken()) { System.out.print(te.toString() + ","); } r.close(); System.out.println(); } }
本人博客該文章鏈接:http://zhenyunboy.icu/?p=280