基本概念
Roaring BitMap 以下簡稱 RBM,中文翻譯為咆哮位圖,它本質上是定義了一個很大的 bit 數組,每個元素對應到 bit 數組的其中一位,一個Integer是32-bit, 一共有Integer.MAX_VALUE = 2 ^ 32個值,32-bit的unsigned integer的集合(共2 ^ 32 = 42 9496 7296個)
這個數足夠覆蓋一款產品的user數或item數(item 泛指是新聞,商品等)
由定義可知,其去重是針對int 型數據進行操作,對於非Integer類型的數據(比如String類型)可以通過數據字典映射成Integer,比如數據庫的ID
bit(位/比特):計算機運算的基礎單位; byte(字節):計算機中文件大小的基本計量單位。 轉換關系: 8 bit = 1 Byte 1024 Byte = 1 KB 1024 KB = 1 MB 1024 MB = 1 GB 1024 GB = 1 TB
未完待續······