es倒排索引原理解析


倒排索引原理

       

   

 

   普通的存儲方式是給每個文檔編一個序號 然后讓這個序號對應單個文檔的所有內容  如果用這樣的方式查找   當需要查找某個單詞的時候需要遍歷所有的文檔集合

   查找文檔的效率會非常的慢

   2.基本倒排索引:

        在存儲文檔的時候不是以單個文檔內容來做為一行存儲的,而是先把所有的文檔內容按照特定的分詞器進行分詞 以被切分后的單詞做為一行來進行存儲

        並且在最后一列保存這個被切分后的單詞出現的文檔編號的集合

   

 

      

 

    3.完善的倒排索引

    

 

分詞原理

    1.寫時分詞

      

    2.讀時分詞

     

 

 

    

 

 

    es對文本內容進行分析的三個步驟   鏈式調用的形式來處理

   

 

 

         

文檔路由原理

     

 

    


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM