花費 26 ms
lucene中的數值型字段(NumericField)

面對字段類型為數值時,lucene表現得並不是很完美,經常會帶來一些意想不到的“問題”。 下面從索引、排序、范圍檢索(rangeQuery)三個方面進行分析。 搜索我們做好准備工作,建立索引。 ...

Fri Aug 10 17:15:00 CST 2012 0 9118
[ lucene擴展 ] spellChecker原理分析

spellChecker是用來對用戶輸入的“檢索內容”進行校正,例如百度上搜索“麻辣將”,他的提示如下圖所示: 我們首先借用lucene簡單實現該功能。 本文內容如下(簡單實現、原理簡介、現 ...

Tue Feb 14 17:11:00 CST 2012 4 6931
[ lucene擴展 ] 自定義Collector實現統計功能

對於lucene的統計,我基本放棄使用factedSearch了,效率不高,而且兩套索引總覺得有點臃腫! 這次我們通過改造Collector,實現簡單的統計功能。經過測試,對幾十萬的統計還是比較快的 ...

Tue Jul 10 23:35:00 CST 2012 1 4485
lucene中的nrt

NRT原理 When you ask for the IndexReader from the IndexWriter, the IndexWriter will be flushed (docs ...

Tue Aug 21 22:37:00 CST 2012 7 2579
[ lucene高級 ] lucene准實時(near realtime)檢索

先撇開其他的不談,我們先看看下面幾段代碼,他們均能實現“實時”檢索。 注意: 1.筆者目前采用的lucene版本為3.5. 2.為了檢查是否“實時”,采用了numDocs是否發生變化進行簡易判斷 ...

Tue Feb 21 00:26:00 CST 2012 0 3827
Lucene - CustomScoreQuery 自定義排序

在某些場景需要做自定義排序(非單值字段排序、非文本相關度排序),除了自己重寫collect、weight,可以借助CustomScoreQuery。 場景:根據tag字段中標簽的數量進行排序(tag ...

Thu Sep 04 04:58:00 CST 2014 0 2215

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM