為了更好的排版, 所以將IK分詞器的安裝重啟了一篇博文, 大家可以接上solr的安裝一同查看.
[Linux]Linux下安裝和配置solr/tomcat/IK分詞器 詳細實例一: http://www.cnblogs.com/wang-meng/p/5814798.html
8, 打開瀏覽器查看solr可視化界面
到了這里solr就配置好了, 可是我們的IK 分詞器還沒有配置呢, 如果不配IK分詞器的話 它是怎樣分詞的呢? 我們就來先看一下:
每個字都分成了一個詞, 這當然不是我們想要的結果, 接下來我們就開始配置IK 分詞器.
9, 使用IK分詞器
復制IK分詞器的jar包到/tomcat/webapp/solr/WEB-INF/lib(這里是solr/WEB-INF下)
lk.cfg.xml 和stopword.dic 復制到tomcat/webapp/WEB-INF/classes下(默認沒有classes目錄, 需自己手動創建)
10, 配置IK分詞器
配置solr家中的schema.xml文件, 包括配置數據類型及自定義的字段
編輯schema.xml, 由於這個文件有1000多行, 所以我們改用notepad++ 來打開(這個軟件相信大家都不陌生)
找到schema.xml並打開修改:
修改如下:
重啟tomcat然后繼續去solr可視化界面查看:
再來看現在的分詞是不是好多了呢? 當然有了IK分詞器還是不夠的, 往往我們還需要配置自己的擴展詞和停詞來滿足我們的需求.
11, 配置擴展詞和停詞
首先看下配置文件:
使用vim編輯IKAnalyzer.cfg.xml:
添加ext.dic文件, 然后在ext.dic文件中添加擴展詞:
同理, 添加停詞可以在stopwork.dic直接添加.
到了這里IK分詞器也配置好了. 哎, 從頭來還是搞了一上午, 不過又重新操作一遍, 對這些又更加熟練了.