Solr6.6 IK 中文分詞的配置和使用


  

  1. 首先,下載IKAnalyzer ,下載

  

  2. 將ik的相關文件 拷貝到 webapps\solr\WEB-INF\lib 目錄下

   或者存放solr-6.6.0\server\solr\test\lib下面,就是在核test下面建立lib文件夾,把對應組件放在lib下面

   

  修改solrconfig.xml,增加如下:

  

 <lib dir="./lib" regex=".*\.jar"/>

 

  

 

 

  3. 在 solr-6.6.0\server\solr\test\conf\managed-schema增加如下配置

  

 <fieldType name="text_ik" class="solr.TextField">
    <analyzer type="index" >
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/CNstopwords.txt" />
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/CNstopwords.txt" />
    </analyzer>
  </fieldType>

  

CNstopwords.txt為通用詞文件

 

 
        

  或

<!-- 我添加的IK分詞 -->
         <fieldType name="text_ik" class="solr.TextField">   
                   <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
                   <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
         </fieldType>

  同時,把需要分詞的字段,設置為text_ik,

  <field name="pathsummary"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />
  <field name="attr_content"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />

  

  4、在admin后台, analysis 下查看分詞效果

  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM