es倒排索引原理解析


倒排索引原理

       

   

 

   普通的存储方式是给每个文档编一个序号 然后让这个序号对应单个文档的所有内容  如果用这样的方式查找   当需要查找某个单词的时候需要遍历所有的文档集合

   查找文档的效率会非常的慢

   2.基本倒排索引:

        在存储文档的时候不是以单个文档内容来做为一行存储的,而是先把所有的文档内容按照特定的分词器进行分词 以被切分后的单词做为一行来进行存储

        并且在最后一列保存这个被切分后的单词出现的文档编号的集合

   

 

      

 

    3.完善的倒排索引

    

 

分词原理

    1.写时分词

      

    2.读时分词

     

 

 

    

 

 

    es对文本内容进行分析的三个步骤   链式调用的形式来处理

   

 

 

         

文档路由原理

     

 

    


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM