标签【91-搜索引擎】

前面我们感觉ES就想是一个nosql数据库，支持Free Schema。接触过Lucene、solr的同学这时可能会思考一个问题——怎么定义document中的field？store、index、 ...

先来一个标准分词（standard），配置如下： curl -XPUT localhost:9200/local -d '{ "settings" : { "analy ...

架构 | 京东商品搜索架构设计

电商搜索系统存在以下特点：数据量庞大。（上亿级别）高并发。（日均pv过亿、数十亿）一条商品数据由商品基本信息、价格、库存、促销、评价等组成，这些数据存储在各自业务系统当中。（多数据源导致构建索引比较麻 ...

一）分词 1）正向/逆向最大匹配算法典型：IKAnalyzer采用的是正向迭代最细粒度切分算法 IKAnalyzer源码简单分析： http://www.cnblogs.com/huangf ...

IKAnalyzer 源码走读

首先摘抄一段关于IK的特性介绍：采用了特有的“正向迭代最细粒度切分算法”，具有60万字/秒的高速处理能力。采用了多子处理器分析模式，支持：英文字母（IP地址、Email、URL）、数字（日期， ...