倒排索引原理


普通的存儲方式是給每個文檔編一個序號 然后讓這個序號對應單個文檔的所有內容 如果用這樣的方式查找 當需要查找某個單詞的時候需要遍歷所有的文檔集合
查找文檔的效率會非常的慢
2.基本倒排索引:
在存儲文檔的時候不是以單個文檔內容來做為一行存儲的,而是先把所有的文檔內容按照特定的分詞器進行分詞 以被切分后的單詞做為一行來進行存儲
並且在最后一列保存這個被切分后的單詞出現的文檔編號的集合


3.完善的倒排索引

分詞原理
1.寫時分詞

2.讀時分詞


es對文本內容進行分析的三個步驟 鏈式調用的形式來處理


文檔路由原理


