Luke 5 發布,可視化 Lucene 索引查看工具
這是一個主要版本,該版本支持 Lucene 5.2.0。
它支持 elasticsearch 1.6.0(Lucene的4.10.4)
已解決的問題:
#20增加支持重建索引並不會存儲領域,不暴露位置的字段值。
Pull Requests:
#23 Elasticsearch 支持和陰影插件組裝
#26 添加 .gitignore 文件
#27 支持 Lucene 5
#28 luke.sh 新增LUKE_PATH ENV變量
Luke 是查詢LUCENE索引文件的工具, 而且用 Luke 的Search可以做查詢
使用luke來管理lucene索引文件
發布時間:2015-03-13 13:07:12編輯:王軍華瀏覽(2259)
參考資料
luke使用及下載:http://www.getopt.org/luke/
luck介紹
做lucene開發的,免不了要和索引文件打交道,但是一些二進制的文件我們怎么去看,下面就要隆重的有請luke了
根據百度百科的說法:Luke是一個用於Lucene搜索引擎的,方便開發和診斷的第三方工具,它可以訪問現有Lucene的索引,並允許您顯示和修改。
我們可以通過luke來進行一般的索引查看和修改操作。
lucene的索引文件就好像是數據庫存儲的數據文件,luke就是一個DBMS系統。
java jdk工具准備
luke的運行是依賴於java jdk的。所以首先應該下載並安裝java jdk。
下載地址是:http://pan.baidu.com/s/1o6NvJBW
luke介紹
首先下載luke,下載地址是:http://pan.baidu.com/s/1o6NvJBW。雙擊運行。
然后上方的菜單欄上的file按鈕就可以打開索引目錄了,如果當前索引已經被打開了(里面有write.lock文件了),我們就可以使用強制解鎖的方法來打開目錄,或者是使用readonly的方法來打開索引目錄,打開后就可以像DBMS一看的查看索引里面保存的數據了,如果索引改變了,可以點擊overview界面上的re-open按鈕重新打開。
共有5個界面:
overview是用來進行索引的一般性查看和操作的,比如索引目錄民,索引文件版本。。。等等概要信息,右上角三個按鈕分別可以重新打開索引,提交索引更改和關閉當前打開的索引,下面兩個list就是顯示詞和字段的相關信息了。
documents界面是用來進行文檔的操作和查看的,比如文件的刪除、添加。下面一個大listview就可以用來查看文檔的詳細信息了,是不是和DBMS的查看表數據非常的像呢?上面有兩個查找文檔的方法,根據文檔編號來查找和根據詞來查找了,其實這個就是搜索了
search界面是我認為最有用的一個界面了,其中我們可以在這里進行索引的搜索測試,可以編寫最的lucene搜索語句,然后可以看到語句解析后的query樹,這樣就可以知道為什么我們有些查詢會查詢不到我們想要的信息了,然后還可以選擇進行搜索的分詞器、默認字段和重復搜索次數的(可以通過多次搜索來獲取平均一個搜索過程的耗時長短,這個對查詢的性能測試時非常有用的),然后下面的listview中就會列出一個搜索的的文檔的所有保存的(store)字段的值,下面可以看到查詢花費的時間
file界面,故名思義,這個就是用來查看每個索引相關文件的一些屬性的界面,具體的話,可以通過這個界面分析下索引文件的多少,是否需要優化或者合並等等。。。。
最后一個plugins界面,就是可以看到luke提供的各種插件,我認為比較有用的還是那個分詞工具,提供一個分詞的類,然后下面文本框輸入一段文本,然后就可以讓這個工具幫你分詞,你可以看到詳細的分詞信息,相信這個對自定義分詞器的調試或者測試還是很有用的。然后還有一個hadoop插件,支持從hadoop節點中獲取節點中文件的相關信息。