【文章推荐】《MapReduce: Simplified Data Processing on Large Cluster 》翻译

原文：《MapReduce: Simplified Data Processing on Large Cluster 》翻译

Abstract MapReduce是一种编程模型和一种用来处理和产生大数据集的相关实现。用户定义map函数来处理key value键值对来产生一系列的中间的key value键值对。还要定义一个reduce函数用来合并有着相同中间key值的中间value。许多现实世界中的任务都可以用这种模型来表达，就像下文所展示的那样。用这个风格编写的程序可以自动并行地在集群上工作。运行时系统会自动处理例如切 ...

2016-10-31 21:22 0 7660 推荐指数：

查看详情

[翻译]MapReduce: Simplified Data Processing on Large Clusters

MapReduce: Simplified Data Processing on Large Clusters MapReduce：面向大型集群的简化数据处理摘要 MapReduce既是一种编程模型，也是一种与之关联的、用于处理和产生大数据集的实现。用户要特化一个map程序去处理key ...

《MapReduce: Simplified Data Processing on Large Clusters》论文研读

MapReduce 论文研读说明：本文为论文《MapReduce: Simplified Data Processing on Large Clusters》的个人理解，难免有理解不到位之处，欢迎交流与指正。论文地址：MapReduce Paper 1. MapReduce ...

elasticsearch报Data too large异常

在线上ES集群日志中发现了如下异常，elasticsearch版本为7.3.2 [2021-03-16T21:05:10,338][DEBUG][o.e.a.a.c.n.i.Transport ...

关于Dubbo异常之Data length too large

最近几日发现生产环境项目打出的日志，每天都在30~50G以上，寻找多次发现问题：首先查看日志只看到大批量的json数据输出，这是方法查询后的返回值输出，期初以为是自己打了logger，结果 ...

elasticsearch CircuitBreakingException FIELDDATA Data too large 异常

本文全部参照：https://blog.csdn.net/hereiskxm/article/details/46744985 这里自己留底记录 1. 产生Data too large异常经排查，原来是ES默认的缓存设置让缓存区只进不出引起的，具体分析一下。 2. ES缓存 ...

Hadoop官方文档翻译——MapReduce Tutorial

MapReduce Tutorial（个人指导） Purpose（目的） Prerequisites（必备条件） Overview（综述） Inputs and Outputs（输入输出） MapReduce - User Interfaces（用户接口 ...

[大牛翻译系列]Hadoop（7）MapReduce：抽样（Sampling）

4.3 抽样（Sampling）用基于MapReduce的程序来处理TB级的数据集，要花费的时间可能是数以小时计。仅仅是优化代码是很难达到良好的效果。在开发和调试代码的时候，没有必要处理整个数据集。但如果在这种情况下要保证数据集能够被正确地处理，就需要用到抽样了。抽样是统计学中的一个方法 ...

Akka官方文档翻译：Cluster Specification

参加了CSDN的一个翻译项目，翻译Akka的文档。CSDN提供的翻译系统不好使，故先排版一下放在博客上。 5.1 集群规范注意：本文档介绍了集群的设计理念。它分成两部分，第一部分描述了当前已经实现的部分，第二部分描述了未来要增强/增加的部分。对未现部分的引用被用脚注[*]标出 ...

原文：《MapReduce: Simplified Data Processing on Large Cluster 》翻译

相关推荐

相关标签