利用java實現簡單的中文分詞功能模塊

本文轉載自查看原文 2020-10-19 16:47 533 java

**第一步**：在復制下列代碼到您的編程軟件項目里之前，還需要下載兩個jar包
**IKAnalyzer2012.jar
lucene-core-3.6.0.jar**
百度網盤下載地址
https://pan.baidu.com/s/1oGec_mqU7PdqkKdA-H4k0Q
提取碼: 9egm
**第二步**：將兩個jar包復制到任意一個文件中（或者你可以新建一個lib文件夾然后把兩個文件復制進去）

**第三步**：右擊項目出現如下頁面，再點擊Build Path下的Configure Build path...

**第四步**：第三步之后頁面會跳出如下窗口，點擊Add jaRs....：

**第五步**：然后找到你復制進項目中的兩個jar包，按Ctrl鍵可以同時選中兩個一起添加

**第六步**：添加后的樣子如下所示，文件圖標變成小奶瓶，最后點擊Apply應用就可以復制代碼運行了。

**第七步**：復制代碼到你的clss文件中運行即可

package com.core.service.impl;（這里改成自己的包名）
import java.io.IOException;
import java.io.StringReader;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import 
org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.wltea.analyzer.lucene.IKAnalyzer;
public class ChineseWordSeg {
public static void main(String[] args) throws IOException {
// 提前准備需要分詞的語言
String t = "你好，我現在還剛剛接觸數據結構，所以還不是太了解!";
// 創建一個分詞對象
Analyzer a = new IKAnalyzer(true);
StringReader r = new StringReader(t);
// 對讀入的語言開始進行分詞操作
TokenStream to = a.tokenStream("", r);
// 獲得CharTermAttribute類
CharTermAttribute te = to.getAttribute(CharTermAttribute.class);
// 依次遍歷分詞數據，注意要轉換成字符串類型
while (to.incrementToken()) {
System.out.print(te.toString() + "，");
}
r.close();
System.out.println();
}
}

本人博客該文章鏈接：http://zhenyunboy.icu/?p=280

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 訂單功能模塊設計與實現如何通過反射實現動態功能模塊加載訂單功能模塊設計與實現 java實現中文分詞 Nginx 功能模塊簡單中文分詞系統的實現 Vue2 實現時空穿梭框功能模塊日程功能模塊【從建模到代碼實現】UML + JavaFX Java秒殺系統--5.秒殺功能模塊 Java動態加載類在功能模塊開發中的作用