如何在java項目中使用lucene


lucene是一個開源的全文檢索引擎工具包,但它不是一個成型的搜索引擎,它的功能就是負責將文本數據按照某種分詞算法進行分詞,分詞后的結果存儲在索引庫中,然后根據關鍵字從索引庫檢檢索。

那么應該如何使用呢?

1. 從官網下載http://lucene.apache.org/並解壓縮

2.我們可以從官網給的示例中學習如何使用,並且官網還提供了說明文檔,可以隨時查閱http://lucene.apache.org/core/4_10_2/core/index.html

下面簡要展示如何運行示例:

示例的源碼所在的目錄是lucene\docs\demo\src-html\org\apache\lucene\demo,是兩個html的文件。

編寫兩三行代碼即可去掉前面的編號,得到java文件,讀者自己完成吧。

新建一個java項目luceneDemo,將html中獲取的IndexFiles.java和SearchFiles.java兩個java文件添加進去。

此時還不能直接運行,所以java文件中給出了錯誤,因為我們的項目還沒有導入lucene的jar包

右鍵項目->Build Path->configure Build Path->add External JARs->添加以下三個jar包

lucene\core\lucene-core-4.10.1.jar

lucene\analysis\common\lucene-analyzers-common-4.10.1.jar

lucene\queryparser\lucene-queryparser-4.10.1.jar

如圖所示

然后就可以運行了

在run configuration里選擇IndexFiles,在arguments里面輸入-docs “你要檢索的文件或文件夾”

點run即開始檢索了,默認將索引文件存放咋項目根目錄的index文件夾里

最后選中SearchFiles.java點運行,出現

Enter query:

在控制台里輸入要搜索的關鍵字即可開始搜索。

 

命令行選項具體看源碼。

 

如果要在自己的項目中使用lucene做文本檢索,步驟與上面類似,關鍵的一步就是添加必要的jar包。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM