花费 9 ms
大数据量下的集合过滤—Bloom Filter

算法背景 如果想判断一个元素是不是在一个集合里,一般想到的是将集合中所有元素保存起来,然后通过比较确定。链表、树、散列表(又叫哈希表,Hash table)等等数据结构都是这种思路,存储位置要么是磁 ...

Sun Jun 24 02:34:00 CST 2018 0 21365
如何判断一个元素在亿级数据中是否存在?

前言 最近有朋友问我这么一个面试题目: 现在有一个非常庞大的数据,假设全是 int 类型。现在我给你一个数,你需要告诉我它是否存在其中(尽量高效)。 需求其实很清晰,只是要判断一个 ...

Mon Nov 26 15:51:00 CST 2018 33 5855
布隆过滤器的改进及其应用实践

1 目的   一个好的过滤算法需要具备的特征有:低时间复杂度、低空间复杂度、低错误率。本算法从低时间复杂度(算法只需要读取一次文件)和空间复杂度出发,通过寻找它们的平衡点以达到低错误率。 2 原理 ...

Mon Jan 27 22:36:00 CST 2014 5 2883

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM