Elasticsearch 搜索模塊之Cross Cluster Search（跨集群搜索）

本文轉載自查看原文 2018-11-20 19:02 891 運維/ 數據庫

Cross Cluster Search簡介

cross-cluster search功能允許任何節點作為跨多個群集的federated client（聯合客戶端），與tribe node不同的是cross-cluster search節點並不會加入remote cluster（遠程集群），而是用輕量的方法連接到remote cluster，以便執行federated search（聯合搜索）

Remote cluster

要使用cross-cluster search之前需要先了解remote cluster

一個remote cluster中有"name"和seed nodes（種子節點）列表以供引用，注冊remote cluster時，會從其中一個seed node來檢查其集群狀態，以便在默認情況下選擇最多三個有資格的節點作為gateway nodes（網關節點），集群中配置了remote cluster的每個節點都連接到一個或多個gateway nodes，並使用它們將federated search到remote cluster。

可以使用集群設置（可以動態更新）在全局指定remote cluster，也可以在各個節點中的elasticsearch.yml指定remote cluster 。

如果節點通過elasticsearch.yml文件配置remote cluster，則可以通過該節點連接到remote cluster。換句話說，federated search只有發送到該節點才能連接到remote cluster。通過cluster settings API 設置的remote cluster集群中的每個節點（設置了cluster.remote.connect: true的節點）都可以連接。

`通過elasticsearch.yml設置`：

cluster:
    remote:
        cluster_one: 
            seeds: 127.0.0.1:9300
        cluster_two: 
            seeds: 127.0.0.1:9301

cluster_one和cluster_two表示與每個群集連接的任意群集別名。這些名稱之后用於區分本地和遠程索引

使用cluster settings API設置：

PUT _cluster/settings
{
  "persistent": {
    "cluster": {
      "remote": {
        "cluster_one": {
          "seeds": [
            "127.0.0.1:9300"
          ]
        },
        "cluster_two": {
          "seeds": [
            "127.0.0.1:9301"
          ]
        },
        "cluster_three": {
          "seeds": [
            "127.0.0.1:9302"
          ]
        }
      }
    }
  }
}

刪除遠程群集：

PUT _cluster/settings
{
  "persistent": {
    "cluster": {
      "remote": {
        "cluster_three": {
          "seeds": null 
        }
      }
    }
  }
}

刪除cluster_three保留cluster_one和cluster_tow

Remote cluster的設置：

cluster.remote.connections_per_cluster

gateway nodes數量，默認是3

cluster.remote.initial_connect_timeout

節點啟動時等待遠程節點的超時時間，默認是30s

cluster.remote.node.attr

一個節點屬性，用於過濾掉remote cluster中符合gateway nodes的節點，比如設置cluster.remote.node.attr=gateway，那么將匹配節點屬性node.attr.gateway: true

cluster.remote.connect

默認情況下，群集中的任意節點都可以充當federated client並連接到remote cluster，cluster.remote.connect可以設置為 false（默認為true）以防止某些節點連接到remote cluster

cluster.remote.${cluster_alias}.skip_unavailable

在節點中跳過特定的群集別名，默認是false

使用cross-cluster search查詢

要搜索遠程集群cluster_one上的twitter索引，index名和集群別用冒號分開：

GET /cluster_one:twitter/_search
{
  "query": {
    "match": {
      "user": "kimchy"
    }
  }
}

與tribe特征相反，cross-cluster search還可以在不同群集上搜索相同名稱的index：

GET /cluster_one:twitter,twitter/_search
{
  "query": {
    "match": {
      "user": "kimchy"
    }
  }
}

搜索結果的歧義與索引在請求中消除歧義的方式相同。即使index名稱相同，這些index也會在合並結果時被視為不同的index。從遠程index檢索的所有結果都將以remote cluster的name為前綴：

{
  "took": 150,
  "timed_out": false,
  "_shards": {
    "total": 2,
    "successful": 2,
    "failed": 0,
    "skipped": 0
  },
  "_clusters": {
    "total": 2,
    "successful": 2,
    "skipped": 0
  },
  "hits": {
    "total": 2,
    "max_score": 1,
    "hits": [
      {
        "_index": "cluster_one:twitter",
        "_type": "_doc",
        "_id": "0",
        "_score": 1,
        "_source": {
          "user": "kimchy",
          "date": "2009-11-15T14:12:12",
          "message": "trying out Elasticsearch",
          "likes": 0
        }
      },
      {
        "_index": "twitter",
        "_type": "_doc",
        "_id": "0",
        "_score": 2,
        "_source": {
          "user": "kimchy",
          "date": "2009-11-15T14:12:12",
          "message": "trying out Elasticsearch",
          "likes": 0
        }
      }
    ]
  }
}

跳過已經斷開連接的集群：

默認情況下，在執行搜索請求時，通過cross-cluster search搜索的所有remote cluster都必須可用，否則整個請求將失敗，並且盡管某些群集可用，但不會返回搜索結果。可以通過skip_unavailable設置使remote cluster可選，默認設置為false。

PUT _cluster/settings
{
  "persistent": {
    "cluster.remote.cluster_two.skip_unavailable": true 
  }
}

cluster_two就變成可選的了

GET /cluster_one:twitter,cluster_two:twitter,twitter/_search 
{
  "query": {
    "match": {
      "user": "kimchy"
    }
  }
}

在本地、cluster_one，cluster_two中搜索索引twitter

{
  "took": 150,
  "timed_out": false,
  "_shards": {
    "total": 2,
    "successful": 2,
    "failed": 0,
    "skipped": 0
  },
  "_clusters": { #clusters部分表示一個群集不可用並被跳過
    "total": 3,
    "successful": 2,
    "skipped": 1
  },
  "hits": {
    "total": 2,
    "max_score": 1,
    "hits": [
      {
        "_index": "cluster_one:twitter",
        "_type": "_doc",
        "_id": "0",
        "_score": 1,
        "_source": {
          "user": "kimchy",
          "date": "2009-11-15T14:12:12",
          "message": "trying out Elasticsearch",
          "likes": 0
        }
      },
      {
        "_index": "twitter",
        "_type": "_doc",
        "_id": "0",
        "_score": 2,
        "_source": {
          "user": "kimchy",
          "date": "2009-11-15T14:12:12",
          "message": "trying out Elasticsearch",
          "likes": 0
        }
      }
    ]
  }
}

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Elasticsearch跨集群搜索(Cross Cluster Search) Elasticsearch：跨集群搜索 Cross-cluster search (CCS) ES cross cluster search跨集群查詢 Elasticsearch：跨集群復制 Cross-cluster replication（CCR) Elasticsearch 跨集群搜索配置 CCS 【Elasticsearch 7 探索之路】（五）搜索相關 Search-API elasticsearch（七）java 搜索功能Search Request的介紹與使用禁忌搜索（Tabu Search）集束搜索（Beam Search） Elastic Search的聚合搜索