利用java实现简单的中文分词功能模块

本文转载自查看原文 2020-10-19 16:47 533 java

**第一步**：在复制下列代码到您的编程软件项目里之前，还需要下载两个jar包
**IKAnalyzer2012.jar
lucene-core-3.6.0.jar**
百度网盘下载地址
https://pan.baidu.com/s/1oGec_mqU7PdqkKdA-H4k0Q
提取码: 9egm
**第二步**：将两个jar包复制到任意一个文件中（或者你可以新建一个lib文件夹然后把两个文件复制进去）

**第三步**：右击项目出现如下页面，再点击Build Path下的Configure Build path...

**第四步**：第三步之后页面会跳出如下窗口，点击Add jaRs....：

**第五步**：然后找到你复制进项目中的两个jar包，按Ctrl键可以同时选中两个一起添加

**第六步**：添加后的样子如下所示，文件图标变成小奶瓶，最后点击Apply应用就可以复制代码运行了。

**第七步**：复制代码到你的clss文件中运行即可

package com.core.service.impl;（这里改成自己的包名）
import java.io.IOException;
import java.io.StringReader;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import 
org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.wltea.analyzer.lucene.IKAnalyzer;
public class ChineseWordSeg {
public static void main(String[] args) throws IOException {
// 提前准备需要分词的语言
String t = "你好，我现在还刚刚接触数据结构，所以还不是太了解!";
// 创建一个分词对象
Analyzer a = new IKAnalyzer(true);
StringReader r = new StringReader(t);
// 对读入的语言开始进行分词操作
TokenStream to = a.tokenStream("", r);
// 获得CharTermAttribute类
CharTermAttribute te = to.getAttribute(CharTermAttribute.class);
// 依次遍历分词数据，注意要转换成字符串类型
while (to.incrementToken()) {
System.out.print(te.toString() + "，");
}
r.close();
System.out.println();
}
}

本人博客该文章链接：http://zhenyunboy.icu/?p=280

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 订单功能模块设计与实现如何通过反射实现动态功能模块加载订单功能模块设计与实现 java实现中文分词 Nginx 功能模块简单中文分词系统的实现 Vue2 实现时空穿梭框功能模块日程功能模块【从建模到代码实现】UML + JavaFX Java秒杀系统--5.秒杀功能模块 Java动态加载类在功能模块开发中的作用