Java實現布隆過濾器

本文轉載自查看原文 2019-06-12 18:23 3928 Java

布隆過濾器

　　布隆過濾器主要用於判斷一個元素是否在一個集合中，它可以使用一個位數組簡潔的表示一個數組。它的空間效率和查詢時間遠遠超過一般的算法，但是它存在一定的誤判的概率，適用於容忍誤判的場景。如果布隆過濾器判斷元素存在於一個集合中，那么大概率是存在在集合中，如果它判斷元素不存在一個集合中，那么一定不存在於集合中。常常被用於大數據去重。

算法思想

　　布隆過濾器算法主要思想就是利用k個哈希函數計算得到不同的哈希值，然后映射到相應的位數組的索引上，將相應的索引位上的值設置為1。判斷該元素是否出現在集合中，就是利用k個不同的哈希函數計算哈希值，看哈希值對應相應索引位置上面的值是否是1，如果有1個不是1，說明該元素不存在在集合中。但是也有可能判斷元素在集合中，但是元素不在，這個元素所有索引位置上面的1都是別的元素設置的，這就導致一定的誤判幾率。布隆過濾的思想如下圖所示：

java實現簡單布隆過濾器（hash+bitset）：

import java.util.ArrayList;
import java.util.BitSet;
import java.util.List;

public class BloomFilter {
    private static final int DEFAULT_SIZE = 2 << 24;
    private static final int[] seeds = new int[] { 5, 7, 11, 13, 31, 37, 61 };
    private BitSet bits = new BitSet(DEFAULT_SIZE);
    private SimpleHash[] func = new SimpleHash[seeds.length];

    public BloomFilter() {
        for (int i = 0; i < seeds.length; i++) {
            func[i] = new SimpleHash(DEFAULT_SIZE, seeds[i]);
        }
    }

    public void add(String value) {
        for (SimpleHash f : func) {
            bits.set(f.hash(value), true);
        }
    }

    public boolean contains(String value) {
        if (value == null) {
            return false;
        }
        boolean ret = true;
        for (SimpleHash f : func) {
            ret = ret && bits.get(f.hash(value));
        }
        return ret;
    }

    // 內部類，simpleHash
    public static class SimpleHash {
        private int cap;
        private int seed;

        public SimpleHash(int cap, int seed) {
            this.cap = cap;
            this.seed = seed;
        }

        public int hash(String value) {
            int result = 0;
            int len = value.length();
            for (int i = 0; i < len; i++) {
                result = seed * result + value.charAt(i);
            }
            return (cap - 1) & result;
        }
    }

    public static void main(String[] args) {
        BloomFilter bf = new BloomFilter();
        List<String> strs = new ArrayList<String>();
        strs.add("123456");
        strs.add("hello word");
        strs.add("transDocId");
        strs.add("123456");
        strs.add("transDocId");
        strs.add("hello word");
        strs.add("test");
        for (int i=0;i<strs.size();i++) {
            String s = strs.get(i);
            boolean bl = bf.contains(s);
            if(bl){
                System.out.println(i+","+s);
            }else{
                bf.add(s);
            }
        }
    }

}

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 布隆(Bloom)過濾器 JAVA實現布隆過濾器（java）布隆過濾器 php實現基於Redis的Java布隆過濾器 Redis實現布隆過濾器布隆過濾器【布隆過濾器】基於Hutool庫實現的布隆過濾器Demo 布隆過濾器布隆過濾器 java中BloomFilter（布隆過濾器）簡單使用