在solr中加入自己的擴展分詞庫方法:
參考文章:
http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html
1、在solr的web中:\WEB-INF目錄下新增一個文件夾:classes
2、新增一個文件:IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> <properties> <comment>IK Analyzer 擴展配置</comment> <!--用戶可以在這里配置自己的擴展字典--> <entry key="ext_dict">my.dic;</entry> <!--用戶可以在這里配置自己的擴展停止詞字典--> <entry key="ext_stopwords">stopword.dic;</entry> </properties>
說明:
my.dic即為擴展分詞庫,分詞庫可以為多個,以分號隔開即可。停止詞庫一樣。
3、新增my.dic文件。文件格式必需是:無BOM的UTF-8格式,示例內容為:
西麗
4、保存,重啟solr。
使用了新的分詞,需要重新建索引數據。
5、測試: