1、搜索被執行成一個兩階段過程,我們稱之為 Query Then Fetch;
2、在初始查詢階段時,查詢會廣播到索引中每一個分片拷貝(主分片或者副本分
片)。 每個分片在本地執行搜索並構建一個匹配文檔的大小為 from + size 的
優先隊列。
PS:在搜索的時候是會查詢 Filesystem Cache 的,但是有部分數據還在 Memory
Buffer,所以搜索是近實時的。
3、每個分片返回各自優先隊列中 所有文檔的 ID 和排序值 給協調節點,它合並
這些值到自己的優先隊列中來產生一個全局排序后的結果列表。
4、接下來就是 取回階段,協調節點辨別出哪些文檔需要被取回並向相關的分片
提交多個 GET 請求。每個分片加載並 豐富 文檔,如果有需要的話,接着返回
文檔給協調節點。一旦所有的文檔都被取回了,協調節點返回結果給客戶端。
5、補充:Query Then Fetch 的搜索類型在文檔相關性打分的時候參考的是本分
片的數據,這樣在文檔數量較少的時候可能不夠准確,DFS Query Then Fetch 增
加了一個預查詢的處理,詢問 Term 和 Document frequency,這個評分更准確,
但是性能會變差。