Clickhouse分布式查詢機器上運行方式

本文轉載自查看原文 2020-08-02 08:44 478 Clickhouse

對於分布式查詢過程是在不同的機器上執行的，可分兩步：

①在遠程服務器上執行盡可能b多的查詢處理階段；

②在請求者服務器上執行其余階段（合並中間結果和之后的所有內容）。

例如，SELECT f（sum（g（x）））FROM distributed_table GROUP BY h（y）中，

如果distributed_table至少有兩個分片，則在遠程服務器上執行函數’g’和’h’，並在請求服務器上執行函數’f’。
如果distributed_table只有一個分片，則在該分片的服務器上執行所有’f’，’g’和’h’功能。

這雖然不影響結果，合理安排每次請求的集群中主機的IP地址，會提高查詢的性能；

使用字典的函數時將使用運行它們的服務器上存在的字典
函數的結果通常不依賴於它在哪個服務器上執行。但是，有時這很重要。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Clickhouse分布式查詢IN/JOIN與GLOABL IN GLOABL JOIN的區別 clickhouse分布式集群 ClickHouse分布式集群搭建指南 Clickhouse 分布式表&本地表 Clickhouse 創建分布式表 clickhouse的分布式Distributed表引擎 Clickhouse distributed 分布式聚合查詢，二次聚合問題 pytest運行方式（六）Locust 分布式運行 tensorflow分布式運行