标签【92-搜索引擎_lucene】

环境搭建一.zookeeper 参考：http://blog.chinaunix.net/uid-25135004-id-4214399.html 现有4台机器 10.14.2.201 ...

面对字段类型为数值时，lucene表现得并不是很完美，经常会带来一些意想不到的“问题”。下面从索引、排序、范围检索（rangeQuery）三个方面进行分析。搜索我们做好准备工作，建立索引。 ...

[ lucene扩展 ] spellChecker原理分析

spellChecker是用来对用户输入的“检索内容”进行校正，例如百度上搜索“麻辣将”，他的提示如下图所示：我们首先借用lucene简单实现该功能。本文内容如下（简单实现、原理简介、现 ...

对于lucene的统计，我基本放弃使用factedSearch了，效率不高，而且两套索引总觉得有点臃肿！这次我们通过改造Collector，实现简单的统计功能。经过测试，对几十万的统计还是比较快的 ...

lucene中的nrt

NRT原理 When you ask for the IndexReader from the IndexWriter, the IndexWriter will be flushed (docs ...

一）分词 1）正向/逆向最大匹配算法典型：IKAnalyzer采用的是正向迭代最细粒度切分算法 IKAnalyzer源码简单分析： http://www.cnblogs.com/huangf ...

先撇开其他的不谈，我们先看看下面几段代码，他们均能实现“实时”检索。注意： 1.笔者目前采用的lucene版本为3.5. 2.为了检查是否“实时”，采用了numDocs是否发生变化进行简易判断 ...

Lucene - CustomScoreQuery 自定义排序

在某些场景需要做自定义排序（非单值字段排序、非文本相关度排序），除了自己重写collect、weight，可以借助CustomScoreQuery。场景：根据tag字段中标签的数量进行排序（tag ...