hanlp添加詞典不起作用


不起作用的原因很多,這里列舉幾個

這里的hanlp我雖然用的maven建立的但是要添加自定義詞典,所以沒有用maven引入的方式,而是下載了data+hanlp.jar文件          data下載地址https://pan.baidu.com/s/1o8Rri0y

 

1、沒有刪除custom文件夾下的所有bin文件

  當添加新詞典后,沒有刪除原來自動生成的緩存詞典,直接運行不成功。所以要刪除這個文件

2、hanlp.properties中配置不對(注意這個文件的位置

·  root=D:/Project/public_sentiment_monitor/plugin/項目名字(hanlp2)/

3、字典文本類型utf-8

4、添加的詞典還要添加到CustomDictionaryPath中      如:

CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt;現代漢語補充詞庫.txt; 全國地名大全.txt ns; 人名詞典.txt; 機構名詞典.txt; 上海地名.txt ns;data/dictionary/person/nrf.txt nrf;data/dictionary/custom/my.txt

5、字典內的文本不要有空格

  如:我愛我 家 n 1

這里我愛我家不能斷

 

 

 

測試程序:

        String text = "比妳聰明的人,請不要讓他還比妳努力";
        System.out.println(HanLP.segment(text)); // 分詞
        System.out.println(HanLP.extractKeyword(text, 2)); // 提取關鍵字,同時指定提取的個數
        System.out.println(HanLP.extractPhrase(text, 2)); // 提取短語,,同時指定提取的個數
        System.out.println(HanLP.extractSummary(text, 2)); // 提取摘要,同時指定提取的個數
        System.out.println(HanLP.getSummary(text,10));  //提取短語,同時指定摘要的最大長度
        System.out.println(HanLP.convertToTraditionalChinese(text)); // 簡體字轉為繁體字
        System.out.println(HanLP.convertToSimplifiedChinese(traditionText)); // 繁體字轉為簡體字
        System.out.println(HanLP.convertToPinyinString(text, " ", false)); // 轉為拼音

 

 

 

 

參考:https://www.cnblogs.com/hufulinblog/p/10025933.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM