[solr] - IKAnalyzer 擴展分詞庫


在solr中加入自己的擴展分詞庫方法:

參考文章:

http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html 

 

1、在solr的web中:\WEB-INF目錄下新增一個文件夾:classes

 

2、新增一個文件:IKAnalyzer.cfg.xml

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
    <comment>IK Analyzer 擴展配置</comment>
    <!--用戶可以在這里配置自己的擴展字典-->
    <entry key="ext_dict">my.dic;</entry> 
    
    <!--用戶可以在這里配置自己的擴展停止詞字典-->
    <entry key="ext_stopwords">stopword.dic;</entry> 
    
</properties>

說明:

my.dic即為擴展分詞庫,分詞庫可以為多個,以分號隔開即可。停止詞庫一樣。

 

3、新增my.dic文件。文件格式必需是:無BOM的UTF-8格式,示例內容為:

西麗

 

4、保存,重啟solr。

使用了新的分詞,需要重新建索引數據。

 

5、測試:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM