本文始发于个人公众号:TechFlow,原创不易,求个关注 今天的文章和大家一起来学习大数据领域一个经常用到的算法——布隆过滤器。如果看过《数学之美》的同学对它应该并不陌生,它经常用在集合的判断 ...
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天的文章和大家一起来学习大数据领域一个经常用到的算法——布隆过滤器。如果看过《数学之美》的同学对它应该并不陌生,它经常用在集合的判断 ...
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是分布式专题的第14篇文章,我们一起来看看NoSQL数据库。 其实我很早就想写写分布式数据库相关的文章,既是我现在正在学习 ...
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是分布式专题的第12篇文章,我们继续来看集群资源管理系统。 上一篇的文章当中我们简单了解了一下什么是分布式集群资源管理,它 ...
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是分布式专题的第13篇,今天的文章我们不讲空洞的理论,来聊一个实际点的问题。 众所周知,微博的程序员经常不定期加班。和别的 ...
注:出于记录对 zookeeper 的学习研究成果目的,并分享经验,根据官方文档翻译整理而成本文,原文地址: http://zookeeper.apache.org/doc/trunk/zookee ...
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是分布式专题的第11篇文章,我们一起来聊聊分布式集群资源管理。 在开始文章之前,我们先来问一个问题,为什么是国际上是亚马逊 ...
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是分布式专题的第10篇文章,我们继续来聊聊LSMT这个数据结构。 LSMT是一个在分布式系统当中应用非常广泛,并且原理直观 ...
前言:Google大数据处理的3篇核心论文 《The Google File System》:http://research.google.com/archive/gfs.html 《MapRed ...
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是分布式系统的第九篇文章。 今天给大家分享的内容是LSM树,它的英文是Log-structed Merge-tree。看着 ...
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是周五分布式系统的第八篇文章,核心内容是B+树的原理。 今天的文章是上周B树的延伸,所以新关注的或者是有所遗忘的同学建议先从下 ...