前提
什么是倒排索引?
Elasticsearch之分詞器的作用
Elasticsearch之分詞器的工作流程
Elasticsearch之停用詞
Elasticsearch的中文分詞器
1、單字分詞:
如:“我們是中國人”
效果:“我”“們”“是”“中”“國”“人”
2、二分法分詞:按兩個字進行切分。
如:“我們是中國人”,效果:“我們”、“們是”、“是中”、“中國”、“國人”。
3、詞庫分詞:按某種算法構造詞,然后去匹配已建好的詞庫集合,如果匹配到就切分出來成為詞語。通常詞庫分詞被認為是最理想的中文分詞算法。
后續博客