倒排索引原理
普通的存儲方式是給每個文檔編一個序號 然后讓這個序號對應單個文檔的所有內容 如果用這樣的方式查找 當需要查找某個單詞的時候需要遍歷所有的文檔集合
查找文檔的效率會非常的慢
2.基本倒排索引:
在存儲文檔的時候不是以單個文檔內容來做為一行存儲的,而是先把所有的文檔內容按照特定的分詞器進行分詞 以被切分后的單詞做為一行來進行存儲
並且在最后一列保存這個被切分后的單詞出現的文檔編號的集合
3.完善的倒排索引
分詞原理
1.寫時分詞
2.讀時分詞
es對文本內容進行分析的三個步驟 鏈式調用的形式來處理
文檔路由原理