中文分詞器


使用因為Elasticsearch中默認的標准分詞器分詞器對中文分詞不是很友好,會將中文詞語拆分成一個一個中文的漢子。因此引入中文分詞器-es-ik插件

在下載使用插件時候 一定要注意 版本對應!

github地址: https://github.com/medcl/elasticsearch-analysis-ik/releases/

 

這個插件里面用到HttpClient 因為要遠程獲取關鍵詞 拉取網上的熱詞  還有es通信

 

安裝:

第一步:下載es的IK插件(資料中有)命名改為ik插件

第二步: 上傳到/home/elasticsearch-6.4.3/plugins

第三步:      unzip ik.zip        

第四步: 重啟elasticsearch即可

 

使用:分詞結果  發送get請求

 

 自定義熱詞,擴展詞:

/elasticsearch-6.4.3/plugins/ik/config目錄下

 

vi custom/new_word.dic  (在ik的目錄中的config下(/home/elasticsearch/elasticsearch-6.4.3/plugins/ik/config)創建一個目錄 下入下面的內容)

老鐵

王者榮耀

洪荒之力

共有產權房

一帶一路

 

 

 修改到指定目錄:

 

 

 然后啟動ES:

成功!

看看:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM