solr的中文分词配置。 1.首先下载最新版本的mmseg4j-1.9.1,之前我安装的solr是4 ...
solr集成mmseg j分词 mmseg j https: code.google.com p mmseg j https: github.com chenlb mmseg j solr 作者blog http: blog.chenlb.com category mmseg j mmseg j 用 Chih Hao Tsai 的 MMSeg 算法 http: technology.chtsai. ...
2014-11-20 15:45 0 4202 推荐指数:
solr的中文分词配置。 1.首先下载最新版本的mmseg4j-1.9.1,之前我安装的solr是4 ...
原文出处:http://blog.chenlb.com/2009/04/solr-chinese-segment-mmseg4j-use-demo.html mmseg4j 第一个版本就可以方便地与 solr 集成,在 google code 上面有简单的说明,第一版的发布博客也有简单 ...
原文出处:http://blog.chenlb.com/2009/04/use-chinese-segment-mmseg4j-in-lucene-demo.html mmseg4j 发布也有一段时间了,前些日子忙着发布新的版本,修正 bug 之类的。使用示例一直拖到现在,其实 svn ...
机器上已安装 : Tomcat 7 jdk1.7 mysql 5.0 访问 http://www.apache.org/dyn/closer.cgi/lucene/solr , 在这个网址里选择一个路径 , 下载 solr 3.5 的版本 solr3.5 在本机解压缩以后 ...
转载请标明出处:http://www.cnblogs.com/chlde/p/3768733.html 1.如何将solr部署,请参考之前的文章 2.按上述配置好后,在solr_home文件夹中,将包含collection1文件夹,这就是solr的一个实例。下面我们来看看collection1 ...
第一次记录一些学习的内容,希望能给和我一样不熟悉中文分词的人一些思路。(写的不好,还请见谅) =====================背景====================== 中文分词的学习是想要给公司其他部门的人做一个简介,让不知道中文分词的人有个初步的认识,而我 ...
关于Solr搜索标点与符号的中文分词你必须知道的(mmseg源码改造) 摘要:在中文搜索中的标点、符号往往也是有语义的,比如我们要搜索“C++”或是“C#”,我们不希望搜索出来的全是“C”吧?那样对程序员来说是个噩梦。然而在中文分词工具mmseg中,它的中文分词是将标点与符号均去除 ...
如今做任何一个系统都有搜索,而搜索界有著名的三剑客: solr/elasticsearch/sphinx solr/elasticsearch 为同一类的,都是基于lucene开发的产品,本人也早在几年前用过solr做过类似中关村的产品搜索,faceting功能非常好用. 近期手头上又有个项目 ...