標簽【91-搜索引擎】

前面我們感覺ES就想是一個nosql數據庫，支持Free Schema。接觸過Lucene、solr的同學這時可能會思考一個問題——怎么定義document中的field？store、index、 ...

先來一個標准分詞（standard），配置如下： curl -XPUT localhost:9200/local -d '{ "settings" : { "analy ...

電商搜索系統存在以下特點：數據量龐大。（上億級別）高並發。（日均pv過億、數十億）一條商品數據由商品基本信息、價格、庫存、促銷、評價等組成，這些數據存儲在各自業務系統當中。（多數據源導致構建索引比較麻 ...

一）分詞 1）正向/逆向最大匹配算法典型：IKAnalyzer采用的是正向迭代最細粒度切分算法 IKAnalyzer源碼簡單分析： http://www.cnblogs.com/huangf ...

首先摘抄一段關於IK的特性介紹：采用了特有的“正向迭代最細粒度切分算法”，具有60萬字/秒的高速處理能力。采用了多子處理器分析模式，支持：英文字母（IP地址、Email、URL）、數字（日期， ...