HanLP分詞器的使用方法


前言:分析關鍵詞
如何在一段文本之中提取出相應的關鍵詞呢?
之前我有想過用機器學習的方法來進行詞法分析,但是在項目中測試時正確率不夠。於是這時候便有了 HanLP-漢語言處理包 來進行提取關鍵詞的想法。

下載:.jar .properties data等文件
這里提供官網下載地址 HanLP下載,1.3.3數據包下載

在intellij中配置環境,並運行第一個demo
在項目中配置jar包,添加依賴。
file->Project Structure->Modules->Dependencies->+Jars

 

將properties文件轉移到src根目錄下,修改root為自己的數據集路徑

 


運行第一個demo
public class TestHanLP {
public static void main(String[] args) {
System.out.println(HanLP.segment("你好,歡迎使用HanLP!"));
}
}

可能的錯誤
字符類型對應表加載失敗:D:/BaiduYunDownload/data-for-1.3.3/data/dictionary/other/CharType.dat.yes

解決辦法:查看錯誤提示頁面下是否有該文件,如果沒有則去網上下載一個。像我這里,由於只是使用其一部分功能,為了方便就不再下載了,這里我直接修改了一個文件的文件名—–成功運行!。

 


成功運行

 

 

文章來源於csu_zipple的博客


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM