[Linux]Linux下安裝和配置solr/tomcat/IK分詞器 詳細實例二.


為了更好的排版, 所以將IK分詞器的安裝重啟了一篇博文,  大家可以接上solr的安裝一同查看.
[Linux]Linux下安裝和配置solr/tomcat/IK分詞器 詳細實例一: http://www.cnblogs.com/wang-meng/p/5814798.html


8, 打開瀏覽器查看solr可視化界面


到了這里solr就配置好了, 可是我們的IK 分詞器還沒有配置呢, 如果不配IK分詞器的話 它是怎樣分詞的呢? 我們就來先看一下: 


每個字都分成了一個詞, 這當然不是我們想要的結果, 接下來我們就開始配置IK 分詞器.

9, 使用IK分詞器
復制IK分詞器的jar包到/tomcat/webapp/solr/WEB-INF/lib(這里是solr/WEB-INF下)


lk.cfg.xml 和stopword.dic 復制到tomcat/webapp/WEB-INF/classes下(默認沒有classes目錄, 需自己手動創建)



10, 配置IK分詞器
配置solr家中的schema.xml文件, 包括配置數據類型及自定義的字段



編輯schema.xml, 由於這個文件有1000多行, 所以我們改用notepad++ 來打開(這個軟件相信大家都不陌生)



找到schema.xml並打開修改: 

修改如下:


重啟tomcat然后繼續去solr可視化界面查看: 


再來看現在的分詞是不是好多了呢? 當然有了IK分詞器還是不夠的, 往往我們還需要配置自己的擴展詞和停詞來滿足我們的需求.

 

11, 配置擴展詞和停詞
首先看下配置文件:

使用vim編輯IKAnalyzer.cfg.xml:


添加ext.dic文件, 然后在ext.dic文件中添加擴展詞:




同理, 添加停詞可以在stopwork.dic直接添加.
到了這里IK分詞器也配置好了. 哎, 從頭來還是搞了一上午, 不過又重新操作一遍, 對這些又更加熟練了.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM