Elasticsearch使用系列-ES增刪查改基本操作+ik分詞


 

Elasticsearch使用系列-ES簡介和環境搭建

Elasticsearch使用系列-ES增刪查改基本操作+ik分詞

Elasticsearch使用系列-基本查詢和聚合查詢+sql插件

Elasticsearch使用系列-.NET6對接Elasticsearch

Elasticsearch使用系列-Docker搭建Elasticsearch集群

一、安裝可視化工具Kibana

ES是一個NoSql數據庫應用。和其他數據庫一樣,我們為了方便操作查看它,需要安裝一個可視化工具 Kibana。

官網:https://www.elastic.co/cn/downloads/kibana

 

 

 

 

 和前面安裝ES一樣,選中對應的環境下載,這里選擇windows環境,注意安裝的版本一定要和ES的版本一致,不然可能會啟動不起來。

解壓后進到config目錄下修改kibana.yml配置文件

 

 

 

 修改完配置,進入bin目錄,雙擊 kibana.bat 文件啟動。

啟動后,打開kibana地址:http://localhost:5601/ ,出現下面界面就是安裝成功了。

 

點自己瀏覽進入下面

 

 點開發工具進入操作ES的界面,我們ES就在下面界面操作。

二、ES數據結構和數據類型

1.ES數據結構

這里以Mysql作對比,ES7.0以前的結構是Index,Type,Document,ES7.0以后廢棄了Type,現在ES和Mysql的結構對比如下

 

MySql Elasitcsearch
database(數據庫) Elasitcsearch(實例)
table(表) index(索引)
row(行) document(文檔)
column(列) field(字段)

 

2.ES數據類型

  • 字符串:textkeyword  (重點類型)
  • 數值:long,integer,short,byte,double,float,half float,scaled float
  • 日期類型:date
  • 布爾類型:boolean
  • 二進制類型:binary
  • 等等。。。

這里的數據類型標紅的是ES的重點類型,其它的和平時開發的類型一樣,沒什么特別。

三、ES的增刪查改基本操作

請求方式 url地址 描述
PUT http://localhost:9200/索引名稱 創建索引
POST http://local  
     
     
     
     

1.創建索引,相當於數據庫創建表

PUT  index

PUT user
{
      "mappings" : {
      "properties" : {
        "age" : {
          "type" : "integer"
        },
      
        "name" : {
          "type" : "text"
        },
         "name2" : {
          "type" : "keyword"
        },
           "name3" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "hobby" : {
          "type" : "text"
        }
      }
    }
}
View Code

 

 

 

這里說一下kibana執行的原理,kibana執行的是http請求,前面的PUT為請求方式,還有POST,GET等,后面的user是索引名稱,因為kibana配置了es的信息,

所以會自動帶上es的地址和端口,實際的請求為 PUT http://192.168.101.13:9200/user

查看索引字段信息

GET index

 

 2.創建文檔,相當於數據庫插入數據記錄

POST index/_doc/id (index:索引名稱,_doc:固定,id:指定記錄id,不填會自動生成一個唯一id)

 

 4.查詢

 4.1查詢全部

GET index/_search

 

 4.2按條件查詢

GET user/_search
{
 "query": {
   "term": {
     "FIELD": {
       "value": "VALUE"
     }
   }
 }
}

 

 

5.更新

對應sql語句:update user set age=19 where id=1

_doc,doc,_update:固定寫法

 

 

6.刪除

6.1刪除文檔(相當於刪除一條數據)

對應sql語句: delete from user where id=1

DELETE user/_doc/1

6.2刪除索引(相當於刪除表)

對應sql語句:drop table user

DELETE user

四、全文索引和ik分詞

1.全文索引

 

創建索引的時候我上面故意創建了name(text),name1(keyword),name2(text+keyword),然后數據類型也說了text,keyword是ES的重點類型,這里演示他們的區別。

  • keyword類型:查詢時條件只能全匹配
  • text類型:全文索引查詢,查詢時會先分詞,然后用分詞去匹配查詢
  • keyword+text類型,一個字段兩種類型,可以全匹配,也可以全文索引查詢

keyword查詢例子,name2(keyword)的查詢:

keyword的查詢用term,或terms(配置多個值)

 

 

 

因為是全匹配,條件”張三“查到數據,條件”張“時查不到數據。 

text查詢例子,name(text)的查詢

text的查詢用match 

 

 

 

 因為是全文索引分詞匹配,所以條件“張三”和條件“張”的,都把匹配到的數據都查詢出來了。

keyword+text查詢例子,name3(text+keyword)的查詢。

當只想查全匹配時,用term查詢

 

 

當想用全文索引查詢時,用match

 

 

2.ik分詞

1.什么是分詞?

 

我搜的是愛祖國,為什么,“愛釣魚,愛唱歌"的都被搜出來了呢?

因為ES默認內置了一個分詞器standard,看下這個分詞器的分詞結果

 

 

 可以看到“愛祖國”的分詞結果為“愛,祖,國”,被拆分成了單個字,只要一個字匹配到就查出來,這樣的結果很多不是我們想要的。我們需要一款根據常用詞語的分詞器,這樣查到的結果會更准確,

這里就用到了ik分詞,ik分詞也是企業開發用的最多的。

 2.ik分詞器插件安裝

官網下載:https://github.com/medcl/elasticsearch-analysis-ik/releases

下載的版本要和es一致。

 

 把文件下載后,解壓復制到es部署文件的plugins文件夾下,並把文件夾的名稱改為ik,必須要叫ik。windows,linux,docker(docker為掛載文件夾的方式把文件映射進去)一樣,

然后重啟es即可生效。

 再看一下用ik分詞器的分詞結果。

 

 可以看到,已經是按常用詞語分詞了。

3.自定義詞組

上面“愛祖國”,被分成“愛祖國,祖國”,假如我想“愛組”也是一個詞,現在這個詞沒被收怎么辦?

打開剛才的ik文件夾下的config目錄

 

 里面的.dic結尾的都是分詞,打開其中一個看一下。

 

 所以我們要自定義詞語,可以新建一個myword.dic

里面寫上想要的分詞

 

 

 

然后在IKAnalyzer.cfg.xml文件加上剛才的文件名

 

 

 重啟es,再看一下分詞結果。

 

 4.ik分詞怎么在索引中使用

創建索引的時候,text類型如果沒指定使用分詞器,就會默認內置的分詞器,所以使用ik分詞器時,創建索引時需要指定。

PUT user2
{
      "mappings" : {
      "properties" : {
        "age" : {
          "type" : "integer"
        },
      
        "name" : {
          "type" : "text"
         
        },
         "name2" : {
          "type" : "keyword"
        },
           "name3" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
            "type" : "keyword",
            "ignore_above" : 256
            }
          },
          "analyzer": "ik_max_word",
          "search_analyzer": "ik_max_word"
        },
        "hobby" : {
          "type" : "text",
          "analyzer": "ik_max_word",
         "search_analyzer" : "ik_max_word"
        }
      }
    }
}
View Code

 

 

 把user的數據復制到user2。

 

 再次查詢“愛祖國”,得到一條想要的數據,沒有多余數據。證明ik分詞在索引中生效了。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM