Solr6.6 IK 中文分詞的配置和使用

本文轉載自查看原文 2018-01-05 15:02 1685 搜索引擎Solr系列/ Solr6.6 IK 中文分詞的配置和使用

　　1. 首先，下載IKAnalyzer ，下載

　　2. 將ik的相關文件拷貝到 webapps\solr\WEB-INF\lib 目錄下

　　　或者存放solr-6.6.0\server\solr\test\lib下面，就是在核test下面建立lib文件夾，把對應組件放在lib下面

　　修改solrconfig.xml，增加如下：

 <lib dir="./lib" regex=".*\.jar"/>

　　3. 在 solr-6.6.0\server\solr\test\conf\managed-schema增加如下配置

 <fieldType name="text_ik" class="solr.TextField">
    <analyzer type="index" >
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/CNstopwords.txt" />
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/CNstopwords.txt" />
    </analyzer>
  </fieldType>

CNstopwords.txt為通用詞文件

　　或

<!-- 我添加的IK分詞 -->
         <fieldType name="text_ik" class="solr.TextField">   
                   <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
                   <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
         </fieldType>

　　同時，把需要分詞的字段，設置為text_ik，

  <field name="pathsummary"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />
  <field name="attr_content"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />

　　4、在admin后台， analysis 下查看分詞效果

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Solr學習總結（八）IK 中文分詞的配置和使用 solr8.0 ik中文分詞器的簡單配置（二） solr8.2 環境搭建配置中文分詞器 ik-analyzer-solr8 詳細步驟 solr6.6教程-基礎環境搭建(一) 在ElasticSearch中使用 IK 中文分詞插件真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql數據庫、IK中文分詞器配置以及web項目中solr的應用(1) solr添加IK分詞和自己定義詞庫使用 docker 部署 elasticsearch 並安裝 ik 中文分詞器 elasticsearch ik中文分詞器的使用詳解 [Linux]Linux下安裝和配置solr/tomcat/IK分詞器詳細實例二.