ElasticSearch搜索引擎安裝配置中文分詞器IK插件


近幾篇ElasticSearch系列:

1、阿里雲服務器Linux系統安裝配置ElasticSearch搜索引擎

2、Linux系統中ElasticSearch搜索引擎安裝配置Head插件

3、ElasticSearch搜索引擎安裝配置中文分詞器IK插件

4、ElasticSearch搜索引擎安裝配置拼音插件pinyin

5、ElasticSearch搜索引擎在JavaWeb項目中的應用

 

 

 

一、IK簡介

ElasticSearch(以下簡稱ES)默認的分詞器是標准分詞器Standard,如果直接使用在處理中文內容的搜索時,中文詞語被分成了一個一個的漢字,因此引入中文分詞器IK就能解決這個問題,同時用戶可以配置自己的擴展字典、遠程擴展字典等。

 

二、IK安裝

1、首先前往GitHub下載安裝包(注意版本與ES對應,若無對應版本,解壓后修改pom.xml文件中的elasticsearch.version,建議查看修改一下版本號),上傳至/home/目錄,並解壓至當前目錄,如下圖所示:

     

 

1 vim /home/elasticsearch-analysis-ik-6.3.2/pom.xml

 

2、然后切換至解壓目錄進行編譯(若無安裝Maven工具,首先安裝Maven才能編譯,具體參考Linux安裝Maven):

1 [root@izwz9eu3mkqq1njlkrfhc8z elasticsearch-analysis-ik-6.3.2]# mvn clean install -Dmaven.test.skip

編譯之后,會在當前目錄下的target/releases找到對應的zip包,如下圖所示:

 

3、然后在/usr/java/elasticsearch/elasticsearch-6.3.2/plugins/目錄下創建analysis-ik,再將上述中的zip包解壓至該目錄,如下圖所示:

1 [root@izwz9eu3mkqq1njlkrfhc8z elasticsearch-analysis-ik-6.3.2]# unzip /home/elasticsearch-analysis-ik-6.3.2/target/releases/elasticsearch-analysis-ik-6.3.2.zip -d /usr/java/elasticsearch/elasticsearch-6.3.2/plugins/analysis-ik/

 

                

 

4、切換至非root用戶,重新啟動ES即可,並且可在Head插件中查看插件信息,如下圖所示:

 

 

三、IK測試

IK分詞器的兩種分詞模式:

ik_max_word: 會將文本做最細粒度的拆分,

ik_smart: 會做最粗粒度的拆分。

這里使用_analyze api對中文段落進行分詞,如下圖所示:

 

 

 

 

 

至此是關於介紹在Linux系統中ElasticSearch搜索引擎安裝配置中文分詞器IK插件,后續會介紹ElasticSearch拼音插件pinyin。

如有疏漏錯誤之處,還請不吝賜教!

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM