Elasticsearch CRUD基本操作


前言
本次我們聊一聊Elasticsearch的基本操作CRUD,他跟我們常用的關系型數據庫的操作又有什么不一樣的地方呢?今天我們就來好好講解一番。

說明

本次演示用的版本是7.11。
工具可以使用Kibana的控制台,界面美觀且有一定的縮進,而且能簡化命令行的curl操作,如果對安裝有問題的,可以看一下我之前的文章。

image.png

API約定

關系型數據庫用的是SQL進行數據的訪問,而Elasticsearch用的是REST進行數據的訪問,HTTP的請求頭PUT、GET、POST、DELETE正好可以對應CRUD(create、read、update、delete)四種數據操作。

數據的格式用的是JSON。

索引操作

創建索引

創建索引movie

PUT /movie
{
  "settings": {
    "index": {
      "number_of_shards": 1,
      "number_of_replicas": 0
    }
  }
}

number_of_shards是主分片數,number_of_replicas是一個主分片有多少個本,那么總的分片數就是“(number_of_replicas + 1) * number_of_shards”

查看索引

GET /movie/

刪除索引

DELETE /movie/

文檔操作

插入文檔

7.x版本,type默認是“_doc”。可以用POST,也可以用PUT

// 自動生成_id
POST /movie/_doc
{
  "title": "The Pursuit of Happyness",
  "actors": [
    "Will Smith",
    "Jaden Smith",
    "Thandie Newton"
  ]
}

// 指定_id=1
PUT /movie/_doc/1
{
  "title": "The Pursuit of Happyness",
  "actors": [
    "Will Smith",
    "Jaden Smith",
    "Thandie Newton"
  ]
}

// 演示覆蓋
PUT /movie/_doc/1
{
  "title": "xxx"
}

如果是指定_id的情況下(稱為index操作),那么如果文檔已經存在的話,會直接進行覆蓋,也就是如果里面有些字段沒傳,那個字段就不會存儲了,比如上面第三個請求,執行完后去獲取“_id=1”的數據,只能獲取到title字段,actors字段是不存在的。

更新文檔

更新“_id=1”的數據,注意需要有“doc”。如果用“POST /movie/_update/1”這種語法,就直接覆蓋了。

POST /movie/_update/1
{
  "doc":{
    "title": "The Pursuit of Happyness xxx"
  }
}

刪除文檔

刪除“_id=1”的數據

DELETE /movie/_doc/1

獲取文檔

獲取“_id=1”的數據

GET /movie/_doc/1

搜索文檔

GET /movies/_search
{
  "profile": "true",
  "_source": ["movieId", "title","genres"], 
  "sort": [{"movieId": "desc"}],
  "from": 0,
  "size": 3,
  "query": {
    "match_all": {}
  }
}
  • movies是之前導入的數據,非前面用的movie,需要測試的話要先導入一下數據。
  • profile 相當於MySQL中的explain
  • _source 是要返回的字段

上面的請求,類比SQL如下

select movieId, title, genres from movies order by movieId desc limit 0, 3

更復雜的搜索查詢,后面持續更新。

批量文檔操作

批量操作

POST movie/_bulk
{"index":{"_index":"movie","_id":1}}
{"title": "xxx xx"}
{"index":{"_index":"movie","_id":2}}
{"title": "The Pursuit of Happyness"}
{"update":{"_index":"movie","_id":2}}
{"doc":{"title": "xxx xx"}}

支持在一次API調用中,對不同的索引做不同的操作,減少網絡請求的次數,提高性能。支持的操作有index、create、update、delete。批量操作,如果其中一條有錯誤沒法執行,不會阻礙其他的請求,會繼續執行下去。

請求體要特別注意一下,不能格式化,而且第一行指定index跟id,第二行指定數據,以此類推。

批量讀取

請求體可以格式化

GET _mget
{
  "docs": [
    {
      "_index": "movie",
      "_id": 1
    },
    {
      "_index": "movie",
      "_id": 2
    }
  ]
}

如果是對同一個index進行操作,可以在URI指定index

GET movie/_mget
{
  "docs": [
    {
      "_id": 1
    },
    {
      "_id": 2
    }
  ]

批量查詢

GET /movies/_msearch
{}
{"from":0,"size":1,"query":{"match_all":{}}}
{}
{"from":0,"size":2,"query":{"match_all":{}}}

與_bulk操作類似,不能進行格式化。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM