原文:[hadoop源码阅读][4]-org.apache.hadoop.io.compress系列3-使用压缩

hadoop中支持的压缩方式有多种,比如Gzip,bzip ,zlib等,其中Gzip是hadoop中内置就支持的一种压缩方式,这种压缩方式在平时linux的开发人员和管理员中使用的比较广泛,压缩比也比较高,压缩速度也还不错,所以很多人都喜欢第一趋向于使用这种压缩格式进行文件的压缩。 在hadoop中,要在mapreduce 的job中使用gzip压缩是比较容易的,不记得是从哪个版本开始,had ...

2012-06-15 17:54 0 3594 推荐指数:

查看详情

[hadoop源码阅读][6]-org.apache.hadoop.ipc-ipc.server

1. nio的reactor模式 具体的处理方式: · 1.一个线程来处理所有连接(使用一个Selector) · 2.一组线程来读取已经建立连接的数据(多个Selector,这里的线程数一般和cpu的核数相当 ...

Fri Jun 22 20:02:00 CST 2012 0 3240
hadoop源码阅读

1、hadoop源码下载 下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/ 2、我们看一下hadoop源码中提供的一个程序WordCount Map()阶段 其中的42-55行 ...

Fri Jan 11 00:24:00 CST 2019 0 818
org.apache.hadoop.ipc.RemoteException(java.io.IOException)

昨晚突然之间mr跑步起来了 jps查看 进程都在的,但是在reduce任务跑了85%的时候会抛异常 异常情况如下: 2016-09-21 21:32:28,538 INFO [org.apache.hadoop.mapreduce.Job] - map 100% reduce 84 ...

Thu Sep 22 23:38:00 CST 2016 0 3411
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM