原文:Nutch搜索引擎(第4期)_ Eclipse开发配置

环境准备 . 本期引言 前三期分别介绍了Nutch与Solr在Linux上面的安装,并做了简单的应用,这一期从开发的角度进行,因为我们日常最熟悉的开发环境是Windows,所以本期详细介绍Windows平台的Nutch二次开发所需要进行的配置安装。当我们开发好之后,最后在部署到Linux环境中。 为了方便以后Nutch开发以及软件安装的管理,我们对开发环境配置进行如下安排: E: 盘符 cygw ...

2014-04-28 09:12 3 10986 推荐指数:

查看详情

Nutch搜索引擎(第1)_ Nutch简介及安装

1、Nutch简介   Nutch是一个由Java实现的,开放源代码(open-source)的web搜索引擎。主要用于收集网页数据,然后对其进行分析,建立索引,以提供相应的接口来对其网页数据进行查询的一套工具。其底层使用了Hadoop来做分布式计算与存储,索引使用了Solr分布式索引框架来做 ...

Fri Mar 21 20:19:00 CST 2014 5 33137
Nutch搜索引擎(第3)_ Nutch简单应用

1、Nutch命令详解 Nutch采用了一种命令的方式进行工作,其命令可以是对局域网方式的单一命令也可以是对整个Web进行爬取的分步命令。 要看Nutch的命令说明,可执行"Nutch"命令。 下面是单个命令的说明: crawl ...

Mon Apr 14 19:03:00 CST 2014 1 8650
Nutch搜索引擎(第2)_ Solr简介及安装

1、Solr简介   Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。   Solr最初 ...

Wed Mar 26 20:08:00 CST 2014 3 6711
关于搜索引擎及其开发

作者:xwjbs 来自:http://blog.csdn.net/xwjbs 转载的时候请注明作者和出处。没有作者的允许,严禁用于商业利益。 托google、百度们成功的福,搜索引擎火了半边天。很多人都想跨到这个行业里边来。前两天在公司里边面试了一些人,基本上没有感到满意 ...

Thu Jul 10 16:29:00 CST 2014 0 4151
搜索引擎1

lucene 和 es 的前世今生 lucene 是最先进、功能最强大的搜索库。如果直接基于 lucene 开发,非常复杂,即便写一些简单的功能,也要写大量的 Java 代码,需要深入理解原理。 elasticsearch 基于 lucene,隐藏了 lucene 的复杂性,提供了简单易用 ...

Wed Nov 20 22:03:00 CST 2019 0 1376
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM