solr與.net系列課程(六)solr定時增量索引與安全
solr增量索引的方式,就是一個Http請求,但是這樣的請求顯然不能滿足要求,我們需要的是一個自動的增量索引,solr官方提供了一個定時器實例,來完成增量索引,
首先下載 apache-solr-dataimportscheduler-1.0.jar,下載地址:http://solr-dataimport-scheduler.googlecode.com/files/apache-solr-dataimportscheduler-1.0.jar
官方地址有時候訪問不了,請點擊這個http://pan.baidu.com/s/1pJt3KZD
下面開始配置
1.將apache-solr-dataimportscheduler-1.0.jar復制到C:\Program Files\Apache Software Foundation\Tomcat 7.0\webapps\solr\WEB-INF\lib (C:\Program Files\Apache Software Foundation\Tomcat 7.0為tomcat安裝路徑)
2.修改C:\Program Files\Apache Software Foundation\Tomcat 7.0\webapps\solr\WEB-INF下的web.xml文件, 在servlet節點前面增加
<listener> <listener-class> org.apache.solr.handler.dataimport.scheduler.ApplicationListener </listener-class> </listener>
3.將apache-solr-dataimportscheduler-.jar 中 dataimport.properties 取出,放入C:\Program Files\Apache Software Foundation\Tomcat 7.0\solr\conf,沒有conf新建一個
4.重啟tomcat即可
dataimport.properties 配置項說明
################################################# # # # dataimport scheduler properties # # # ################################################# # to sync or not to sync # 1 - active; anything else - inactive syncEnabled=1 # which cores to schedule # in a multi-core environment you can decide which cores you want syncronized # leave empty or comment it out if using single-core deployment syncCores=game,resource # solr server name or IP address # [defaults to localhost if empty] server=localhost # solr server port # [defaults to 80 if empty] port=8080 # application name/context # [defaults to current ServletContextListener's context (app) name] webapp=solr # URL params [mandatory] # remainder of URL params=/select?qt=/dataimport&command=delta-import&clean=false&commit=true # schedule interval # number of minutes between two runs # [defaults to 30 if empty] interval=1 # 重做索引的時間間隔,單位分鍾,默認7200,即1天; # 為空,為0,或者注釋掉:表示永不重做索引 reBuildIndexInterval=2 # 重做索引的參數 reBuildIndexParams=/select?qt=/dataimport&command=full-import&clean=true&commit=true # 重做索引時間間隔的計時開始時間,第一次真正執行的時間=reBuildIndexBeginTime+reBuildIndexInterval*60*1000; # 兩種格式:2012-04-11 03:10:00 或者 03:10:00,后一種會自動補全日期部分為服務啟動時的日期 reBuildIndexBeginTime=03:10:00
以上是原文,#后面的是注釋,我們來翻譯一下
################################################# # # # dataimport scheduler properties # # # ################################################# syncEnabled=1 #要定時的增量索引的核心,多核逗號隔開 collection1, collection2 syncCores= collection1 # 這個就不用說了,服務器地址 server=192.168.0.9 port=8080 webapp=solr # 增量索引執行的命令 params=/dataimport?command=delta-import&clean=false&commit=true #多長時間執行一次,默認單位分鍾 interval=30 #下面的,是有人更改了該文件,新加的定時重建索引,原包是不帶定時重建索引的,只有增量索引,官方的包是不支持下面三句話的,不需要可以刪掉 reBuildIndexInterval=7200 reBuildIndexParams=/dataimport?command=full-import&clean=true&commit=true reBuildIndexBeginTime=03:10:00
如果大家搜索其他的文章,會看見有人說官方提供的包有bug,因為官方是用post提交的,但我經過測試,官方的可以正常使用,以上的在本人的項目中可以正常使用.
如果想了解在原包中增加定時從建索引的,和該包中的bug的請參考下面的文章 http://www.denghuafeng.com/post-242.html
好了,上述工作完成后,你的solr就可以定時增量索引了,
下面我們來講解一下solr安全性的問題
了解solr后,大家都知道了,solr是通過Http請求去執行所有操作的,那問題就來了,如果別人知道了你的solr服務器的地址就很危險了,solr的新增和刪除也都是通過http請求來完成的,地址暴漏后,你的數據就容易受到攻擊了.我這里的解決辦法是,設置tomcat的訪問權限,只有固定ip可以訪問,這樣別人就訪問不了你的solr了
修改C:\Program Files\Apache Software Foundation\Tomcat 7.0\conf\server.xml,加入ip限制即可
全局設置,對Tomcat下所有應用生效
server.xml中添加下面一行,重啟服務器即可:
<Valve className="org.apache.catalina.valves.RemoteAddrValve" allow="192.168.1.*" deny=""/> 此行放在</Host>之前。
例:
1,只允許192.168.1.10訪問:
<Valve className="org.apache.catalina.valves.RemoteAddrValve"allow="192.168.1.10" deny=""/>
2,只允許192.168.1.*網段訪問:<Valve className="org.apache.catalina.valves.RemoteAddrValve" allow="192.168.1.*" deny=""/>
3,只允許192.168.1.10、192.168.1.30訪 <Valve className="org.apache.catalina.valves.RemoteAddrValve" allow="192.168.1.10,192.168.1.30" deny=""/>
4,根據主機名進行限制:
<Valve className="org.apache.catalina.valves.RemoteHostValve" allow="abc.com" deny=""/>
qq群: 424259523
