Solr4+IKAnalyzer的安裝配置


一、下載Solr4.10.2
我們以Windows版本為例,solr-4.10.2.zip是目前最新版本,下載地址:
http://www.apache.org/dyn/closer.cgi/lucene/solr/4.10.2
二、   Solr安裝:

1、解壓solr-4.10.2.zip

2、將 solr-4.10.2/example/webapps/solr.war 拷貝到Tomcat的webapps目錄下(如D:\apache-tomcat-7.0.57\webapps),重新啟動Tomcat 並訪問http://localhost:8080/(目的是解壓solr.war),然后你會發現solr-4.10.2/example/webapps/下多了一個Solr的目錄。

3、在D:\apache-tomcat-7.0.57\webapps\solr創建solr_home目錄:

4、修改D:\apache-tomcat-7.0.57\webapps\solr\WEB-INF\web.xml 添加如下配置(apache-tomcat-7.0.56/webapps/solr/WEB-INF/web.xml)

配置solr home的地址:

   <env-entry>
   <env-entry-name>solr/home</env-entry-name>
<env-entry-value>
    D:\apache-tomcat-7.0.57\webapps\solr\solr_home
</env-entry-value>
   <env-entry-type>java.lang.String</env-entry-type>
</env-entry> 

5、復制solr-4.10.2的solr-4.10.2/example/solr/ 所有內容copy到solr_home

              image

6、復制solr-4.10.2的solr-4.10.2/example/lib/ext目錄下所有文件

               image

到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/lib

復制solr-4.10.2的example/resources目錄下的log4j.properties文件到Tomcat的lib下;

啟動Tomcat。

訪問:http://localhost:8080/solr 進入到管理界面

            image

  三、  集成ikanalyzer中文分詞器

1、在谷歌http://code.google.com/p/ik-analyzer/downloads/list下載IK Analyzer 2012FF_hf1解壓后得到如下目錄結構:

         image

2、將IKAnalyzer2012FF_u1.jar包copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/lib 下。

在apache-tomcat-7.0.56/webapps/solr/WEB-INF/下創建classes目錄

將IKAnalyzer.cfg.xml、stopword.dic  copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/classes

3、修改apache-tomcat-7.0.56/webapps/solr/solr_home/collection1/conf/schema.xml

在第一個節點內添加如下配置:

<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
 </fieldType>

將對應需要用ik分詞的字段的type改為以上定義的name值 text_ik(大約120行處):

   <field name="sku" type="text_en_splitting_tight" indexed="true" stored="true" omitNorms="true"/>
   <field name="name" type="text_ik" indexed="true" stored="true"/>
   <field name="manu" type="text_ik" indexed="true" stored="true" omitNorms="true"/>

配置完成,重啟tomcat並訪問http://localhost:8080/solr。 發現左邊可以選擇分詞器

      image

根據我們配置的中文分詞器,選擇Manu:

     image

分析一個熊孩子造的句子:小明吃完水果然后喝水

 image

發現非常智能的構建出關鍵詞了。

 

centos下面的配置:

創建solr目錄
/usr/local/solr/tomcat
復制tomcat到指定目錄cp apache-tomcat-7.0.47 /usr/local/solr/tomcat -r
將解壓后的war復制到tomcat運行目錄下cp solr-4.10.3.war  /usr/local/solr/tomcat/webapps/solr.war
啟動tomcat解壓war包 ./startup.sh
查看啟動情況:tail -f logs/catalina.out
關閉tomcat:./shutdown.sh
刪除war包:rm -rf solr.war
復制lib包cp -f /root/solr-4.10.3/example/lib/ext/* /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib
創建solrhome:cp -r /root/solr-4.10.3/example/solr /usr/local/solr/solrhome
進入/usr/local/solr/tomcat/webapps/solr/WEB-INF/
修改web.xml中,注意去掉注釋
<env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>/usr/local/solr/solrhome</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>
 
 
 然后啟動,然后訪問/solr/即可
 
 
 
 配置分詞
 cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib
 在/usr/local/solr/tomcat/webapps/solr/WEB-INF/
 創建mkdir classes
 復制配置文件cp ext_stopword.dic IKAnalyzer.cfg.xml mydict.dic /usr/local/solr/tomcat/webapps/solr/WEB-INF/classes

復制schema.xml到/usr/local/solr/solrhome/collection1/conf
cp -rf  schema.xml /usr/local/solr/solrhome/collection1/conf
復制solrconfig.xml到/usr/local/solr/solrhome/collection1/conf
cp -rf  solrconfig.xml /usr/local/solr/solrhome/collection1/conf


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM