Hadoop MapReduce 上利用Lucene实现分布式索引
在HDFS上处理数据时,为快速访问,有时候需要对数据进行分布式索引。很不巧,我们所熟悉的Lucene并不支持HDFS上的索引操作。Lucene中的Document不支持MapReduce输出类型的 ...
在HDFS上处理数据时,为快速访问,有时候需要对数据进行分布式索引。很不巧,我们所熟悉的Lucene并不支持HDFS上的索引操作。Lucene中的Document不支持MapReduce输出类型的 ...