Solr7.7安裝,配置中文分詞 IKAnalyzer分詞


ik文件包下載:IK-analyzer   提取碼: solr    備用地址下載:IK-analyzer

配置從下面開始,1到3是必要的步驟,4到6是注釋說明文件怎么用的

1.將ik-analyzer-7.7.0.jar包放入/soft/solr-7.7.0/server/solr-webapp/webapp/WEB-INF/lib/目錄下

cp /soft/ik-analyzer-7.7.0.jar /soft/solr-7.7.0/server/solr-webapp/webapp/WEB-INF/lib/

2.將resources目錄下的5個配置文件放入soft/solr-7.7.0/server/solr-webapp/webapp/WEB-INF/classes/目錄下,用客戶端工具,直接拖拽到目錄下
① IKAnalyzer.cfg.xml
② ext.dic
③ stopword.dic
④ ik.conf
⑤ dynamicdic.txt

3.配置Solr的managed-schema,添加ik分詞器,示例如下;
<!-- ik分詞器 -->
<fieldType name="text_ik" class="solr.TextField">
  <analyzer type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

4.重啟Solr服務,測試分詞;

 


5.ik.conf文件說明:
files=dynamicdic.txt
lastupdate=0
files為動態詞典列表,可以設置多個詞典表,用逗號進行分隔,默認動態詞典表為dynamicdic.txt;
lastupdate默認值為0,每次對動態詞典表修改后請+1,不然不會將詞典表中新的詞語添加到內存中。


6.dynamicdic.txt 為動態詞典
在此文件配置的詞語不需重啟服務即可加載進內存中。 以#開頭的詞語視為注釋,將不會加載到內存中


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM