lucene是一個開源的全文檢索引擎工具包,但它不是一個成型的搜索引擎,它的功能就是負責將文本數據按照某種分詞算法進行分詞,分詞后的結果存儲在索引庫中,然后根據關鍵字從索引庫檢檢索。
那么應該如何使用呢?
1. 從官網下載http://lucene.apache.org/並解壓縮
2.我們可以從官網給的示例中學習如何使用,並且官網還提供了說明文檔,可以隨時查閱http://lucene.apache.org/core/4_10_2/core/index.html
下面簡要展示如何運行示例:
示例的源碼所在的目錄是lucene\docs\demo\src-html\org\apache\lucene\demo,是兩個html的文件。
編寫兩三行代碼即可去掉前面的編號,得到java文件,讀者自己完成吧。
新建一個java項目luceneDemo,將html中獲取的IndexFiles.java和SearchFiles.java兩個java文件添加進去。
此時還不能直接運行,所以java文件中給出了錯誤,因為我們的項目還沒有導入lucene的jar包。
右鍵項目->Build Path->configure Build Path->add External JARs->添加以下三個jar包
lucene\core\lucene-core-4.10.1.jar
lucene\analysis\common\lucene-analyzers-common-4.10.1.jar
lucene\queryparser\lucene-queryparser-4.10.1.jar
如圖所示
然后就可以運行了
在run configuration里選擇IndexFiles,在arguments里面輸入-docs “你要檢索的文件或文件夾”
點run即開始檢索了,默認將索引文件存放咋項目根目錄的index文件夾里
最后選中SearchFiles.java點運行,出現
Enter query:
在控制台里輸入要搜索的關鍵字即可開始搜索。
命令行選項具體看源碼。
如果要在自己的項目中使用lucene做文本檢索,步驟與上面類似,關鍵的一步就是添加必要的jar包。