摘自騰訊雲實驗室
https://cloud.tencent.com/developer/labs/search?keyword=elastics
安裝java
lasticsearch 需要 java8 以上;
這里安裝最新版的 java10 ;
下載 jdk
wget --no-cookies --no-check-certificate --header "Cookie: gpw_e24=http:%2F%2Fwww.oracle.com%2F; oraclelicense=accept-securebackup-cookie" "http://download.oracle.com/otn-pub/java/jdk/10.0.2+13/19aef61b38124481863b1413dce1855f/jdk-10.0.2_linux-x64_bin.rpm"
因為版本會一直升級;
如果執行上面這段代碼返回了 ERROR 404: Not Found ;
那說明有新版本了;
那就自己去官網復制最新的下載鏈接;
http://www.oracle.com/technetwork/java/javase/downloads/jdk10-downloads-4416644.html ;
選中 Accept License Agreement 然后在 jdk-10.0.2_linux-x64_bin.rpm 上右鍵復制鏈接地址;
替換上面命令中的下載鏈接;
替換上面命令中的下載鏈接;
因為從國外下載比較慢;
為了方便實驗;
我這里把 10.0.2 版本的先下載下來上傳到騰訊雲了;
可以用下面的鏈接代替;
為了方便實驗;
我這里把 10.0.2 版本的先下載下來上傳到騰訊雲了;
可以用下面的鏈接代替;
wget https://study-1251254015.cos.ap-beijing.myqcloud.com/jdk-10.0.2_linux-x64_bin.rpm
安裝 jdk 注意文件名要跟鏈接中的保持一致;
sudo rpm -ivh jdk-10.0.2_linux-x64_bin.rpm
能查看到版本號則表示安裝成功;
java -version
安裝ElasticSearch
下載 elasticsearch ;
官網的下載鏈接是:
https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.2.4.rpm 因為從國外下載比較慢;
為了方便實驗我給先下載下來上傳到騰訊雲了;
可以使用下面的命令代替官網鏈接;
為了方便實驗我給先下載下來上傳到騰訊雲了;
可以使用下面的命令代替官網鏈接;
wget https://study-1251254015.cos.ap-beijing.myqcloud.com/elasticsearch-6.2.4.rpm
安裝 elasticsearch ;
sudo rpm -ivh elasticsearch-6.2.4.rpm
安裝完成后編輯配置項;
vim /etc/elasticsearch/elasticsearch.yml
去掉下面三行的注釋;
bootstrap.memory_lock: true network.host: 192.168.0.1 http.port: 9200
然后把 network.host 改成
localhost
啟動 elasticsearch ;
sudo systemctl daemon-reload sudo systemctl enable elasticsearch.service sudo systemctl start elasticsearch
稍等片刻給 elasticsearch 個啟動的時間;
因為 elasticsearch 啟動的略慢;
后續涉及到重啟 elasticsearch 的時候也都記得稍等片刻;
然后查看 9200 端口檢查是否成功啟動;
因為 elasticsearch 啟動的略慢;
后續涉及到重啟 elasticsearch 的時候也都記得稍等片刻;
然后查看 9200 端口檢查是否成功啟動;
netstat -plntu
如果半天過后仍然沒有啟動起來;
可能是內存不夠出錯;
可能是內存不夠出錯;
vim /etc/elasticsearch/jvm.options
把內存改為自己服務器內存的一半以下;
比如說這里改為 512M ;
比如說這里改為 512M ;

嘗試啟動;
sudo systemctl restart elasticsearch
然后查看 9200 端口檢查是否成功啟動;
netstat -plntu
查看狀態是否正常;
curl 'localhost:9200'

至此 elasticsearch 算是安裝完成了;
安裝中文分詞
安裝 ik-analyzer
但是如果想用來搜索中文;
還需要安裝中文分詞;
怎么算分詞呢?
全文搜索和中文分詞 文章中已經簡單介紹過了;
這里我們從 elasticsearch 實戰一遍;
比如說
elasticsearch 內置的分詞器對中文相當不友好;
只會一個只一個字的分;
還需要安裝中文分詞;
怎么算分詞呢?
全文搜索和中文分詞 文章中已經簡單介紹過了;
這里我們從 elasticsearch 實戰一遍;
比如說
白俊遙技術博客
這句話;
elasticsearch 內置的分詞器對中文相當不友好;
只會一個只一個字的分;
curl -H 'Content-Type: application/json' -XGET 'localhost:9200/_analyze?pretty' -d '{"text":"白俊遙技術博客"}'

所以我們需要一個中文分詞器;
這里選擇和 elasticsearch 配套的 ik-analyzer ;
安裝 ik-analyzer ;
這里選擇和 elasticsearch 配套的 ik-analyzer ;
安裝 ik-analyzer ;
/usr/share/elasticsearch/bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.4/elasticsearch-analysis-ik-6.2.4.zip
如果報下面這種錯誤的話可能是網絡不好;
Exception in thread "main" java.net.ConnectException: Connection timed out (Connection timed out) at java.base/jdk.internal.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
沐浴更衣大念帥白最帥;
再試幾次即可;
實在不行;
那還是用我下載好的鏈接吧;
再試幾次即可;
實在不行;
那還是用我下載好的鏈接吧;
/usr/share/elasticsearch/bin/elasticsearch-plugin install https://study-1251254015.cos.ap-beijing.myqcloud.com/elasticsearch-analysis-ik-6.2.4.zip
然后重新啟動下服務;
sudo systemctl restart elasticsearch
然后查看 9200 端口檢查是否成功啟動;
netstat -plntu
看下 ik-analyzer 的效果;
curl -H 'Content-Type: application/json' -XGET 'localhost:9200/_analyze?pretty' -d '{"analyzer":"ik_max_word","text":"白俊遙技術博客"}'

我們可以看到 技術 和 博客 兩個詞語已經成功組合到了一起;
然而本博主 白俊遙 的名字被硬生生的拆成了3個字這怎么忍;
還好強大的 analysis-ik 支持自定義詞庫;
增加自定義詞庫;
然而本博主 白俊遙 的名字被硬生生的拆成了3個字這怎么忍;
還好強大的 analysis-ik 支持自定義詞庫;
增加自定義詞庫;
vim /etc/elasticsearch/analysis-ik/IKAnalyzer.cfg.xml
在 ext_dict 中自定義一個詞庫文件 baijunyao.dic ;

增加一個 白俊遙 到詞庫;
echo '白俊遙' > /etc/elasticsearch/analysis-ik/baijunyao.dic
重新啟動下服務;
sudo systemctl restart elasticsearch
然后查看 9200 端口檢查是否成功啟動;
netstat -plntu
再看下分詞效果 ;
curl -H 'Content-Type: application/json' -XGET 'localhost:9200/_analyze?pretty' -d '{"analyzer":"ik_max_word","text":"白俊遙技術博客"}'

完工;