[solr] - IKAnalyzer 分詞加入


1、下載IK Analyzer中文分詞器:http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip

 

2、解壓出zip文件,將IKAnalyzer2012FF_u1.jar復制到tomcat中的solr\WEB-INF\lib目錄中

 

3、在tomcat的solr\WEB-INF目錄中,新建一個classes文件夾,將解壓出的zip文件中的IKAnalyzer.cfg.xml和stopword.dic復制到classes中

 

4、用記事本打開E:\solrhome\mycore\conf\schema.xml文件,加入這句話到<schema/>節點內:

    <fieldType name="text_general" class="solr.TextField">
        <analyzer type="index" class="org.wltea.analyzer.lucene.IKAnalyzer" />
        <analyzer type="query" class="org.wltea.analyzer.lucene.IKAnalyzer" />
    </fieldType>

schema.xml是solr core位置,具體參見第一篇文章:http://www.cnblogs.com/HD/p/3977799.html

 

5、啟動或重啟tomcat

 

6、進入solr web: http://localhost:8899/solr

輸入:一直以來,我都這樣輕輕的走着

結果:

 

7、使用post.jar測試:

<add>
    <doc>
      <field name="id">88SS-CSS2</field>
      <field name="name">我是Robin</field>
      <field name="name1">my name 1</field>
      <field name="publisher_id">12</field>
      <field name="core0">welcome</field>
      <field name="text">一直以來,我都是這樣輕輕的走着...</field>
    </doc>
    <doc>
      <field name="id">OMC-9923</field>
      <field name="name">My test core, ha ha solr, I am come in.ss</field>
      <field name="text">國家主席習xx17日抵達古吉拉特邦艾哈邁達巴德市,開始對印度進行國事訪問。 當地時間下午2時50分許,習xx乘坐的專機抵達艾哈邁達巴德的機場。習xx和夫人彭xx受到印度古吉拉特邦邦長克利、首席部長帕特爾、印度駐華大使康特等熱情迎接。圖為習xx和夫人彭xx在印度總理莫迪陪同下一起盪秋千。</field>
    </doc>
</add>

如何使用post.jar測試,參見第一篇文章:http://www.cnblogs.com/HD/p/3977799.html

 

結果:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM