一、Elasticsearch中的基本概念

以下概念基於這個例子：存儲員工數據，每個文檔代表一個員工

1）索引（index）

　　在Elasticsearch中存儲數據的行為就叫做索引(indexing)。

2）類型（type）

　　在Elasticsearch中，文檔歸屬於一種類型(type),而這些類型存在於索引(index)中

3）文檔（documents）

　　Elasticsearch是面向文檔(document oriented)的，這意味着它可以存儲整個對象或文檔(document)。然而它不僅僅是存儲，還會索引(index)每個文檔的內容使之可以被搜索。在Elasticsearch中，你可以對文檔（而非成行成列的數據）進行索引、搜索、排序、過濾。這種理解數據的方式與以往完全不同，這也是Elasticsearch能夠執行復雜的全文搜索的原因之一。

JSON

　　ELasticsearch使用Javascript對象符號(JavaScript Object Notation)，也就是JSON，作為文檔序列化格式。JSON現在已經被大多語言所支持，而且已經成為NoSQL領域的標准格式。它簡潔、簡單且容易閱讀。

以下使用JSON文檔來表示一個用戶對象：　

{
    "email":      "john@smith.com", "first_name": "John", "last_name": "Smith", "info": { "bio": "Eco-warrior and defender of the weak", "age": 25, "interests": [ "dolphins", "whales" ] }, "join_date": "2014/05/01" }

　　盡管原始的user對象很復雜，但它的結構和對象的含義已經被完整的體現在JSON中了，在Elasticsearch中將對象轉化為JSON並做索引要比在表結構中做相同的事情簡單的多。

4）字段（Fields）

　　每個文檔包含多個字段(Fields)

我們可以畫一些簡單的對比圖來類比傳統關系型數據庫：

Relational DB -> Databases -> Tables -> Rows -> Columns
Elasticsearch -> Indices   -> Types  -> Documents -> Fields

　　Elasticsearch集群可以包含多個索引(indices)（數據庫），每一個索引可以包含多個類型(types)（表），每一個類型包含多個文檔(documents)（行），然后每個文檔包含多個字段(Fields)（列）。

二、索引含義的區分

你可能已經注意到索引(index)這個詞在Elasticsearch中有着不同的含義，所以有必要在此做一下區分:

索引（名詞）：如上文所述，一個索引(index)就像是傳統關系數據庫中的數據庫，它是相關文檔存儲的地方，index的復數是indices 或indexes。
索引（動詞）：「索引一個文檔」表示把一個文檔存儲到索引（名詞）里，以便它可以被檢索或者查詢。這很像SQL中的INSERT關鍵字，差別是，如果文檔已經存在，新的文檔將覆蓋舊的文檔。
倒排索引：傳統數據庫為特定列增加一個索引，例如B-Tree索引來加速檢索。Elasticsearch和Lucene使用一種叫做倒排索引(inverted index)的數據結構來達到相同目的。

默認情況下，文檔中的所有字段都會被索引（擁有一個倒排索引），只有這樣他們才是可被搜索的。　　

三、如何創建一個員工目錄

創建員工目錄，我們將進行如下操作

為每個員工的文檔(document)建立索引，每個文檔包含了相應員工的所有信息。
每個文檔的類型為employee。
employee類型歸屬於索引megacorp。
megacorp索引存儲在Elasticsearch集群中。

實際上這些都是很容易的（盡管看起來有許多步驟）。我們能通過一個命令執行完整的操作：

PUT /megacorp/employee/1
{
    "first_name" : "John",
    "last_name" :  "Smith",
    "age" :        25,
    "about" :      "I love to go rock climbing",
    "interests": [ "sports", "music" ]
}

我們看到path:/megacorp/employee/1包含三部分信息：

megacorp    索引名
employee    類型名
1    　　　　這個員工的ID

請求實體（JSON文檔），包含了這個員工的所有信息。他的名字叫“John Smith”，25歲，喜歡攀岩。

　　很簡單吧！它不需要你做額外的管理操作，比如創建索引或者定義每個字段的數據類型。我們能夠直接索引文檔，Elasticsearch已經內置所有的缺省設置，所有管理操作都是透明的。
　　接下來，讓我們在目錄中加入更多員工信息：

PUT /megacorp/employee/2
{
    "first_name" :  "Jane",
    "last_name" :   "Smith",
    "age" :         32,
    "about" :       "I like to collect rock albums",
    "interests":  [ "music" ]
}

PUT /megacorp/employee/3
{
    "first_name" :  "Douglas",
    "last_name" :   "Fir",
    "age" :         35,
    "about":        "I like to build cabinets",
    "interests":  [ "forestry" ]
}

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 分布式搜索引擎-ElasticSearch詳解分布式搜索引擎Elasticsearch的查詢與過濾 ES(ElasticSearch)分布式全文搜索引擎分布式搜索引擎Elasticsearch的簡單使用分布式搜索引擎Elasticsearch（ES）在CentOS7中的安裝基於Luence的分布式搜索引擎ElasticSearch搜索實例演示(Java API) 【分布式搜索引擎】Elasticsearch之開啟Elasticsearch的用戶名密碼驗證分布式搜索引擎Elasticsearch性能優化與配置分布式全文搜索引擎ElasticSearch—超詳細實時分布式搜索引擎比較（senseidb、Solr、elasticsearch）