Redis中bitmap的妙用


https://segmentfault.com/a/1190000008188655

BitMap是什么

就是通過一個bit位來表示某個元素對應的值或者狀態,其中的key就是對應元素本身。我們知道8個bit可以組成一個Byte,所以bitmap本身會極大的節省儲存空間。

Redis中的BitMap

Redis從2.2.0版本開始新增了setbit,getbit,bitcount等幾個bitmap相關命令。雖然是新命令,但是並沒有新增新的數據類型,因為setbit等命令只不過是在set上的擴展。

setbit命令介紹

指令 SETBIT key offset value
復雜度 O(1)
設置或者清空key的value(字符串)在offset處的bit值(只能只0或者1)。

空間占用、以及第一次分配空間需要的時間

在一台2010MacBook Pro上,offset為2^32-1(分配512MB)需要~300ms,offset為2^30-1(分配128MB)需要~80ms,offset為2^28-1(分配32MB)需要~30ms,offset為2^26-1(分配8MB)需要8ms。<來自官方文檔>
大概的空間占用計算公式是:($offset/8/1024/1024)MB

使用場景一:用戶簽到

很多網站都提供了簽到功能(這里不考慮數據落地事宜),並且需要展示最近一個月的簽到情況,如果使用bitmap我們怎么做?一言不合亮代碼!

<?php $redis = new Redis(); $redis->connect('127.0.0.1'); //用戶uid $uid = 1; //記錄有uid的key $cacheKey = sprintf("sign_%d", $uid); //開始有簽到功能的日期 $startDate = '2017-01-01'; //今天的日期 $todayDate = '2017-01-21'; //計算offset $startTime = strtotime($startDate); $todayTime = strtotime($todayDate); $offset = floor(($todayTime - $startTime) / 86400); echo "今天是第{$offset}天" . PHP_EOL; //簽到 //一年一個用戶會占用多少空間呢?大約365/8=45.625個字節,好小,有木有被驚呆? $redis->setBit($cacheKey, $offset, 1); //查詢簽到情況 $bitStatus = $redis->getBit($cacheKey, $offset); echo 1 == $bitStatus ? '今天已經簽到啦' : '還沒有簽到呢'; echo PHP_EOL; //計算總簽到次數 echo $redis->bitCount($cacheKey) . PHP_EOL; /** * 計算某段時間內的簽到次數 * 很不幸啊,bitCount雖然提供了start和end參數,但是這個說的是字符串的位置,而不是對應"位"的位置 * 幸運的是我們可以通過get命令將value取出來,自己解析。並且這個value不會太大,上面計算過一年一個用戶只需要45個字節 * 給我們的網站定一個小目標,運行30年,那么一共需要1.31KB(就問你屌不屌?) */ //這是個錯誤的計算方式 echo $redis->bitCount($cacheKey, 0, 20) . PHP_EOL; 

使用場景二:統計活躍用戶

使用時間作為cacheKey,然后用戶ID為offset,如果當日活躍過就設置為1
那么我該如果計算某幾天/月/年的活躍用戶呢(暫且約定,統計時間內只有有一天在線就稱為活躍),有請下一個redis的命令
命令 BITOP operation destkey key [key ...]
說明:對一個或多個保存二進制位的字符串 key 進行位元操作,並將結果保存到 destkey 上。
說明:BITOP 命令支持 AND 、 OR 、 NOT 、 XOR 這四種操作中的任意一種參數

//日期對應的活躍用戶 
$data = array(
 '2017-01-10' => array(1,2,3,4,5,6,7,8,9,10),
 '2017-01-11' => array(1,2,3,4,5,6,7,8),
 '2017-01-12' => array(1,2,3,4,5,6),
 '2017-01-13' => array(1,2,3,4),
 '2017-01-14' => array(1,2)
 );
 
//批量設置活躍狀態
 foreach($data as $date=>$uids) {
 $cacheKey = sprintf("stat_%s", $date);
 foreach($uids as $uid) {
 $redis->setBit($cacheKey, $uid, 1);
 } 
} 

$redis->bitOp('AND', 'stat', 'stat_2017-01-10', 'stat_2017-01-11', 'stat_2017-01-12') . PHP_EOL;
 //總活躍用戶:6
 echo "總活躍用戶:" . $redis->bitCount('stat') . PHP_EOL;

 $redis->bitOp('AND', 'stat1', 'stat_2017-01-10', 'stat_2017-01-11', 'stat_2017-01-14') . PHP_EOL;
 //總活躍用戶:2
 echo "總活躍用戶:" . $redis->bitCount('stat1') . PHP_EOL; 

$redis->bitOp('AND', 'stat2', 'stat_2017-01-10', 'stat_2017-01-11') . PHP_EOL;
 //總活躍用戶:8
 echo "總活躍用戶:" . $redis->bitCount('stat2') . PHP_EOL;

假設當前站點有5000W用戶,那么一天的數據大約為50000000/8/1024/1024=6MB

使用場景三:用戶在線狀態

前段時間開發一個項目,對方給我提供了一個查詢當前用戶是否在線的接口。不了解對方是怎么做的,自己考慮了一下,使用bitmap是一個節約空間效率又高的一種方法,只需要一個key,然后用戶ID為offset,如果在線就設置為1,不在線就設置為0,和上面的場景一樣,5000W用戶只需要6MB的空間。

//批量設置在線狀態 $uids = range(1, 500000);
 foreach($uids as $uid) {
 $redis->setBit('online', $uid, $uid % 2); 
}
 //一個一個獲取狀態 
$uids = range(1, 500000);
 $startTime = microtime(true);
 foreach($uids as $uid) {
 echo $redis->getBit('online', $uid) . PHP_EOL; 
} 
$endTime = microtime(true);
 //在我的電腦上,獲取50W個用戶的狀態需要25秒
 echo "total:" . ($endTime - $startTime) . "s"; 


/**
 * 對於批量的獲取,上面是一種效率低的辦法,實際可以通過get獲取到value,然后自己計算
 * 具體計算方法改天再寫吧,之前寫的代碼找不見了。。。
 */

其實BitMap可以運用的場景很多很多(當然也會受到一些限制),思維可以繼續擴散~歡迎小伙伴給我留言探討~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM