對於分布式查詢過程是在不同的機器上執行的,可分兩步:
①在遠程服務器上執行盡可能b多的查詢處理階段;
②在請求者服務器上執行其余階段(合並中間結果和之后的所有內容)。
例如,SELECT f(sum(g(x)))FROM distributed_table GROUP BY h(y)中,
如果distributed_table至少有兩個分片,則在遠程服務器上執行函數’g’和’h’,並在請求服務器上執行函數’f’。
如果distributed_table只有一個分片,則在該分片的服務器上執行所有’f’,’g’和’h’功能。
這雖然不影響結果,合理安排每次請求的集群中主機的IP地址,會提高查詢的性能;
使用字典的函數時將使用運行它們的服務器上存在的字典
函數的結果通常不依賴於它在哪個服務器上執行。但是,有時這很重要。