Redis BitMap適應場景


https://blog.csdn.net/paul_wei2008/article/details/53366588

Bitmap以及Redis Bitmaps快速入門(Crash Course on Bitmap and Redis Bitmaps)

Bitmap(即Bitset)
    Bitmap是一串連續的2進制數字(0或1),每一位所在的位置為偏移(offset),在bitmap上可執行AND,OR,XOR以及其它位操作。


位圖計數(Population Count)

    位圖計數統計的是bitmap中值為1的位的個數。位圖計數的效率很高,例如,一個bitmap包含10億個位,90%的位都置為1,在一台MacBook Pro上對其做位圖計數需要21.1ms。SSE4甚至有對整形(integer)做位圖計數的硬件指令。

Redis Bitmaps

    Redis允許使用二進制數據的Key(binary keys) 和二進制數據的Value(binary values)。Bitmap就是二進制數據的value。Redis的 setbit(key, offset, value)操作對指定的key的value的指定偏移(offset)的位置1或0,時間復雜度是O(1)。


 

一個簡單的例子:日活躍用戶

    為了統計今日登錄的用戶數,我們建立了一個bitmap,每一位標識一個用戶ID。當某個用戶訪問我們的網頁或執行了某個操作,就在bitmap中把標識此用戶的位置為1。在Redis中獲取此bitmap的key值是通過用戶執行操作的類型和時間戳獲得的。

這個簡單的例子中,每次用戶登錄時會執行一次redis.setbit(daily_active_users, user_id, 1)。將bitmap中對應位置的位置為1,時間復雜度是O(1)。統計bitmap結果顯示有今天有9個用戶登錄。Bitmap的key是daily_active_users,它的值是1011110100100101。

    因為日活躍用戶每天都變化,所以需要每天創建一個新的bitmap。我們簡單地把日期添加到key后面,實現了這個功能。例如,要統計某一天有多少個用戶至少聽了一個音樂app中的一首歌曲,可以把這個bitmap的redis key設計為play:yyyy-mm-dd-hh。當用戶聽了一首歌曲,我們只是簡單地在bitmap中把標識這個用戶的位置為1,時間復雜度是O(1)。

[java] 
 

  • Redis.setbit(play:yyyy-mm-dd, user_id, 1)  


Redis.setbit(play:yyyy-mm-dd, user_id, 1)
    今天聽過歌曲的用戶就是key是play:yyyy-mm-dd的bitmap的位圖計數。如果要按周或月統計,只要對這周或這個月的所有bitmap求並集,得出新的bitmap,在對它做位圖計數

   利用這些bitmap做其它復雜的統計也非常容易。例如,統計11月聽過歌曲的高級用戶(premium user):
(play:2011-11-01∪ play:2011-11-02∪ … ∪ play:2011-11-30)∩premium:2011-11

 

1億2千8百萬用戶的性能比較(Performance comparison using 128 million users)

    下面的表格顯示了在1億2千8百萬用戶上完成的時間粒度為1天,一周,一個月的用戶統計的時間消耗比較。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM