Elasticsearch之中文分詞器


 

前提

什么是倒排索引?

Elasticsearch之分詞器的作用

Elasticsearch之分詞器的工作流程

Elasticsearch之停用

 

 

 

 

 

 

Elasticsearch的中文分詞器

  1、單字分詞

    如:“我們是中國人”
    效果:“我”“們”“是”“中”“國”“人”

  2、二分法分詞:按兩個字進行切分。

    如:“我們是中國人”,效果:“我們”、“們是”、“是中”、“中國”、“國人”。

  3、詞庫分詞:按某種算法構造詞,然后去匹配已建好的詞庫集合,如果匹配到就切分出來成為詞語。通常詞庫分詞被認為是最理想的中文分詞算法。

 

 

 

 

 

 

 

  后續博客

Elasticsearch之幾個重要的分詞器


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM