最近,很多朋友問我solr 中文分詞配置的問題,都不知道怎么配置,怎么使用,原以為很簡單,沒想到這么多朋友都有問題,所以今天就總結總結中文分詞的配置吧。 有的時候,用戶搜索的關鍵字,可能是一句話,不是很規范。所以在 Solr 中查詢出的時候,就需要將用戶輸入的關鍵字進行分詞 ...
前言 用過Lucene.net的都知道,我們自己搭建索引服務器時和解決搜索匹配度的問題都用到過盤古分詞。其中包含一個詞典。 那么既然用到了這種國際化的框架,那么就避免不了中文分詞。尤其是國內特殊行業比較多。比如油田系統從勘探 打井 投產等若干環節都涉及一些專業詞匯。 再像電商,手機 手機配件 筆記本 筆記本配件之類。汽車,品牌 車系 車型等等,這一系列數據背后都涉及各自領域的專業名次,所以中文分詞 ...
2016-06-21 18:03 0 5454 推薦指數:
最近,很多朋友問我solr 中文分詞配置的問題,都不知道怎么配置,怎么使用,原以為很簡單,沒想到這么多朋友都有問題,所以今天就總結總結中文分詞的配置吧。 有的時候,用戶搜索的關鍵字,可能是一句話,不是很規范。所以在 Solr 中查詢出的時候,就需要將用戶輸入的關鍵字進行分詞 ...
1. 首先,下載IKAnalyzer ,下載 2. 將ik的相關文件 拷貝到 webapps\solr\WEB-INF\lib 目錄下 或者存放solr-6.6.0\server\solr\test\lib下面,就是在核test下面建立lib文件夾,把對應組件放在 ...
前言 前前后后接觸Solr有一個多月了,想趁着學習Solr順便把java拾起來。我分別用4.X和5.X版本在windows環境下用jetty的方式、tomcat部署的方式自己搭建了一把。其中從4.x到5.x和6.x的變化還是有的。搭建起來Solr后我分別用調用http接口的方式 ...
Solr版本和IK分詞版本一定對應 (ps我版本沒對應好弄了快倆小時了) 只適合Solr 5.0.0版本 1.下載IK分詞器包 鏈接: https://pan.baidu.com/s/1hrXovly 密碼: 7yhs 2.解壓並把IKAnalyzer-5.0.jar ...
下載ik分詞器,由於是solr8.0,一些ik分詞器版本可能不兼容,以下是個人親測可行的版本 ik分詞器下載 然后將解壓出來的兩個jar包放到以下路徑: 其它的三個文件放到以下路徑: 如果沒有classes文件夾就創建一個 然后進行ik分詞器的配置,編輯以下路徑 ...
安裝環境 jdk1.7 solr-4.10.3.tgz KAnalyzer2012FF_u1.jar tomcat7 VM虛擬機redhat6.5-x64:192.168.1.201 Xshell4 部署方案 單機部署201 ...
一、下載安裝Apache Solr 8.2.0 下載地址:http://lucene.apache.org/solr/downloads.html 因為是部署部署在windows系統上,所以下載zip壓縮包即可。 下載完成后解壓出來。 二、啟動solr服務 進入 ...
solr7.2.1環境搭建和配置ik中文分詞器 安裝環境:Jdk 1.8、 windows 10 安裝包准備: solr 各種版本集合下載:http://archive.apache.org/dist/lucene/solr/ tomcat下載 ...