微吐槽## hello,world. 不想了,我等码农,还是看看怎么来处理分布式系统中的事务这个老大难吧! 本文略长,读者需要有一定耐心,如果你是高级码农或者架构师级别,你可以跳过。 本文注 ...
微吐槽## hello,world. 不想了,我等码农,还是看看怎么来处理分布式系统中的事务这个老大难吧! 本文略长,读者需要有一定耐心,如果你是高级码农或者架构师级别,你可以跳过。 本文注 ...
实时计算是什么?## 请看下面的图: 我们以热卖产品的统计为例,看下传统的计算手段: 将用户行为、log等信息清洗后保存在数据库中. 将订单信息保存在数据库中. 利用触发器或者 ...
上篇:http://www.cnblogs.com/foreach-break/p/external_sort.html 字符集和编码 字节序 I/O方式 内存 磁盘 ...
问题 给你1个文件bigdata,大小4663M,5亿个数,文件中的数据随机,如下一行一个整数: 现在要对这个文件进行排序,怎么搞? 内部排序## 先尝试内排,选2种排序方式: ...
背景 最近收到这样一个问题: Storm处理消息时会根据Topology生成一棵消息树,Storm如何跟踪每个消息、如何保证消息不丢失以及如何实现重发消息机制? 虽已回复,但心想还是看 ...
1.本文目的 通过解析客户端创建文件流程,认知hadoop的HDFS系统的一些功能和概念。 2.主要概念 2.1 NameNode(NN): HDFS系统核心组件,负责分布式文件系统的名字 ...
背景## 在上篇:storm的基础框架分析 基本探讨了storm的: worker、executor等组件的关系. 线程模型和消息系统. 任务分配流程. topology提交到 ...
背景## 前期收到的问题: 1、在Topology中我们可以指定spout、bolt的并行度,在提交Topology时Storm如何将spout、bolt自动发布到每个服务器并且控制服务的C ...
背景 前期收到的问题: 1、在Topology中我们可以指定spout、bolt的并行度,在提交Topology时Storm如何将spout、bolt自动发布到每个服务器并且控制服务的CPU ...
早期的一篇文章,针对Hadoop 2.6.0. 一、Listener## Listener线程,当Server处于运行状态时,其负责监听来自客户端的连接,并使用Select模式处理Accept ...