elasticsearch 安裝hanlp插件


第一種方法:

1.HanLP分詞器插件下載地址
https://github.com/pengcong90/elasticsearch-analysis-hanlp/releases
下載analysis-hanlp.zip


2.解壓到ElasticSearch下plugins目錄下


3.配置
修改analysis-hanlp目錄下的hanlp.properties文件,修改root的屬性,值為analysis-hanlp下的data 目錄的地址
修改analysis-hanlp目錄下的plugin-descriptor.properties文件,elasticsearch.version=你的es版本號(like:5.5.1)


修改es config目錄下的jvm.options文件,最后一行添加
-Djava.security.policy=../plugins/analysis-hanlp/plugin-security.policy


4.HanLP有以下兩種分詞器
hanlp-index:盡可能的切分多的結果
hanlp-smart:切分少的詞
---------------------
 
第二種方法:

安裝步驟

1. 下載安裝ES對應Plugin Release版本

安裝方式:

方式一

a. 下載對應的release安裝包

b. 將相關內容解壓至ES_HOME/plugins/analysis-hanlp

c. 將config目錄下的文件移動至ES_HOME/config/analysis-hanlp

d. 解壓出的data目錄為詞典目錄

方式二

a. 使用elasticsearch插件腳本安裝command如下:

./bin/elasticsearch-plugin install https://github.com/KennFalcon/elasticsearch-analysis-hanlp/releases/download/v6.5.4/elasticsearch-analysis-hanlp-6.5.4.zip

2. 安裝數據包

release包中存放的為HanLP源碼中默認的分詞數據,若要下載完整版數據包,請查看HanLP Release

數據包目錄:ES_HOME/analysis-hanlp

注:因原版數據包自定義詞典部分文件名為中文,這里的hanlp.properties中已修改為英文,請對應修改文件名

3. 重啟Elasticsearch

注:上述說明中的ES_HOME為自己的ES安裝路徑,需要絕對路徑

4. 熱更新

在本版本中,增加了詞典熱更新,修改步驟如下:

a. 在ES_HOME/analysis-hanlp/data/dictionary/custom目錄中新增自定義詞典

b. 修改hanlp.properties,修改CustomDictionaryPath,增加自定義詞典配置

c. 等待1分鍾后,詞典自動加載

注:每個節點都需要做上述更改

提供的分詞方式說明

hanlp: hanlp默認分詞

hanlp_standard: 標准分詞

hanlp_index: 索引分詞

hanlp_nlp: NLP分詞

hanlp_n_short: N-最短路分詞

hanlp_dijkstra: 最短路分詞

hanlp_crf: CRF分詞(在hanlp 1.6.6已開始廢棄)

hanlp_speed: 極速詞典分詞

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM