詳細描述一下 Elasticsearch 搜索的過程?


1、搜索被執行成一個兩階段過程,我們稱之為 Query Then Fetch;

2、在初始查詢階段時,查詢會廣播到索引中每一個分片拷貝(主分片或者副本分

片)。 每個分片在本地執行搜索並構建一個匹配文檔的大小為 from + size 的

優先隊列。

PS:在搜索的時候是會查詢 Filesystem Cache 的,但是有部分數據還在 Memory

Buffer,所以搜索是近實時的。

3、每個分片返回各自優先隊列中 所有文檔的 ID 和排序值 給協調節點,它合並

這些值到自己的優先隊列中來產生一個全局排序后的結果列表。

4、接下來就是 取回階段,協調節點辨別出哪些文檔需要被取回並向相關的分片

提交多個 GET 請求。每個分片加載並 豐富 文檔,如果有需要的話,接着返回

文檔給協調節點。一旦所有的文檔都被取回了,協調節點返回結果給客戶端。

5、補充:Query Then Fetch 的搜索類型在文檔相關性打分的時候參考的是本分

片的數據,這樣在文檔數量較少的時候可能不夠准確,DFS Query Then Fetch 增

加了一個預查詢的處理,詢問 Term 和 Document frequency,這個評分更准確,

但是性能會變差。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM