ES Java 客戶端


標簽(空格分隔): ES


Java 客戶端

節點客戶端(node client):

節點客戶端本身也是一個ES節點(一般不保存數據,不能成為主節點),它能以無數據節點身份加入到集群中。因為它是集群環境中的一個節點,所以它知道整個集群狀態(所有節點駐留,分片分布在哪些節點等等), 可以把需要執行的操作自動路由到節點上,而少一個網絡躍點。

Node node =  NodeBuilder.nodeBuilder().local(true).node() ;
Client client = node.client();
GetResponse getResponse = client.prepareGet(index, type, "2").get();
System.out.println(JSONObject.toJSONString(getResponse));

當你啟動node時,你可以在你的項目/src/main/resources/elasticsearch.yml文件中定義簡單的設置cluster.name或者明確地使用clusterName方法來加入到指定的集群中。

  • 使用elasticsearch.yml的方式
cluster.name: yourclustername
  • 通過Java的方式
 Node node =  NodeBuilder.nodeBuilder().clusterName("elasticsearch").local(true).node() ;

使用節點客戶端的好處是,操作可以自動地路由到這些操作被執行的節點,而不需要執行雙跳(double hop)。例如,索引操作將會在該操作最終存在的分片上執行。

當你啟動了一個節點,最重要的決定是它是否將保有數據。大多數情況下,我們僅僅需要用到clients,而不需要分片分配給它們。這可以通過設置node.data為false或者設置node.local為true來簡單實現。

Node node =  NodeBuilder.nodeBuilder().local(true).node() ;
Client client = node.client();

傳輸客戶端(Transport Client)

作為更輕量的傳輸客戶端能夠請求到遠程集群。它自己不加入集群,只是簡單的獲得一個或者多個初始化的transport地址,並以輪詢的方式與這些地址進行通信。比較像傳統的CS程序的架構,比如數據庫連接。

Settings settings = Settings.builder().put("cluster.name", "my-application").build();
TransportClient transportClient = TransportClient.builder()
  .settings(settings)
  .build()
  .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("XXX.XXX.XXX.XXX"),   9300));

傳輸客戶端可以嗅到集群的其他部分,並將它們加入到機器列表。為了開啟該功能,可以設置client.transport.sniff為true。

其他的transfersport客戶端設置有如下幾個:

Parameter Description
client.transport.ignore_cluster_name true:忽略連接節點的集群名驗證
client.transport.ping_timeout ping一個節點的響應時間,默認是5s
client.transport.nodes_sampler_interval sample/ping 節點的時間間隔,默認是5s

節點客戶端與傳輸客戶端的區別

  1. 第一種方式,相當於額外啟動了一個ES的node節點,這個節點和集群中的其他節點沒有任何區別。只是這個node是由我們編碼控制的,可以設置這個node是不存數據的節點(沒有特殊原因你就應該這個設置)。

  2. 第二種方法,相當於獲取了所有node節點的client,發送請求的時候遍歷當前可用的client(這里可用指的是可以連接,但是node本身不一定可用,比如node正在恢復中,還沒有加入到集群,這就會產生問題。)跟方法一相比,方法二會產生雙跳(double hop),即當前遍歷到node1,但訪問的數據在node2,請求先轉發到node1,又由node1轉發到node2。

  3. 遍歷方式:每次請求通過AtomicInteger進行原子加1(超過最大值后設置為0),按當前可用client數取模。

  4. 獲取當前可用client的方法:使用線程池,遍歷當前可用client,如果client未連接,嘗試進行一次連接,連接成功加入可用client中,如果client已經連接直接加入可用client。

  5. 可以通過設置client.transport.sniff是否為true,來設置是使用SimpleNodeSampler還是SniffNOdesSampler,默認是false,就是使用SimpleNodeSampler。具體實現在org.elasticsearch.client.transport.TransportClientNodesService 中。

  6. 簡單的說,SimpleNodeSampler會限制當前可用client一定是在配置中設置的節點。而SniffNodesSampler會使用所有發現的client,即使這個client的node,不在配置中。

  7. 當集群中某個node掛掉之后,重新加入的時候,因為是通過判斷client是否可以連接,而不是node是否可用,這會導致這個時候使用這個client發送請求的時候產生異常。而方法一不會,因為還沒加入集群的node,對於自己創建的node來說是不可見的。

使用情況

  • 如果要將應用程序和Elasticsearch集群進行解耦,傳輸客戶端是一個理想的選擇。例如 如果你的應用程序需要快速的創建和銷毀到集群的鏈接,傳輸客戶端比節點客戶端更"輕",因為它不是集群的

參考文檔

  1. Elasticsearch: 權威指南
  2. elasticsearch 2種客戶端的區別
  3. 客戶端


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM