elasticsearch擴展ik分詞器詞庫


操作步驟

1、進入elasticsearch的plugin,進入ik。進入config。
2、在config下面建立以.dic為后綴的字典。在建立的時候一定要注意文本的報錯格式,請保存為utf-8格式的,其他格式不能使用。文件如果在linux中通過vi生成,則不用管格式。可以直接使用。
3、建立好后,在里面輸入我們的擴展詞語。每個擴展詞語一行。
4、維護好字典后,編輯IKAnalyzer.cfg.xml。

<properties>
  <comment>IK Analyzer 擴展配置</comment>
 
  <!--用戶可以在這里配置自己的擴展字典,多個字典使用;號進行隔開 -->
  <entry key="ext_dict">custom.dic</entry>
 
  <!--用戶可以在這里配置自己的擴展停止詞字典-->
  <entry key="ext_stopwords">custom.dic</entry>

</properties>

所謂停止詞字典,就是說如果遇到該詞請不要認為是一個詞。
5、重啟后,分詞效果即生效。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM