Redis中3種特殊的數據類型(BitMap、Geo和HyperLogLog)


前言

Reids 在 Web 應用的開發中使用非常廣泛,幾乎所有的后端技術都會有涉及到 Redis 的使用。Redis 種除了常見的字符串 String、字典 Hash、列表 List、集合 Set、有序集合 SortedSet 等等之外,還有一些不常用的數據類型,這里着重介紹三個。下面話不多說了,來一起看看詳細的介紹吧。

BitMap

BitMap 就是通過一個 bit 位來表示某個元素對應的值或者狀態, 其中的 key 就是對應元素本身,實際上底層也是通過對字符串的操作來實現。Redis 從 2.2 版本之后新增了setbit, getbit, bitcount 等幾個 bitmap 相關命令。雖然是新命令,但是本身都是對字符串的操作,我們先來看看語法:

?
1
SETBIT key offset value

其中 offset 必須是數字,value 只能是 0 或者 1,咋一看感覺沒啥用處,我們先來看看 bitmap 的具體表示,當我們使用命令 setbit key (0,2,5,9,12) 1后,它的具體表示為:

 

byte bit0 bit1 bit2 bit3 bit4 bit5 bit6 bit7
byte0 1 0 1 0 0 1 0 0
byte1 0 1 0 0 1 0 0 0

 

可以看出 bit 的默認值是 0,那么 BitMap 在實際開發的運用呢?這里舉一個例子:儲存用戶在線狀態。這里只需要一個 key,然后把用戶 ID 作為 offset,如果在線就設置為 1,不在線就設置為 0。實例代碼:

?
1
2
3
4
5
6
7
8
9
10
11
//設置在線狀態
$redis->setBit('online', $uid, 1);
 
//設置離線狀態
$redis->setBit('online', $uid, 0);
 
//獲取狀態
$isOnline = $redis->getBit('online', $uid);
 
//獲取在線人數
$isOnline = $redis->bitCount('online');

Geo

Redis 的 GEO 特性在 Redis 3.2 版本中推出, 這個功能可以將用戶給定的地理位置信息儲存起來, 並對這些信息進行操作。GEO 的數據結構總共有六個命令:geoadd、geopos、geodist、georadius、georadiusbymember、gethash,這里着重講解幾個。

1.GEOADD

?
1
GEOADD key longitude latitude member [longitude latitude member ...]

將給定的空間元素(緯度、經度、名字)添加到指定的鍵里面。 這些數據會以有序集合的形式被儲存在鍵里面, 從而使得像 GEORADIUS 和 GEORADIUSBYMEMBER 這樣的命令可以在之后通過位置查詢取得這些元素。例子:

?
1
2
redis> GEOADD Sicily 13.361389 38.115556 "Palermo" 15.087269 37.502669 "Catania"
(integer) 2

2.GEOPOS

?
1
GEOPOS key member [member ...]

從鍵里面返回所有給定位置元素的位置(經度和緯度),例子:

?
1
2
3
redis> GEOPOS Sicily Palermo Catania NonExisting
1) 1) "13.361389338970184"
  2) "38.115556395496299"

3.GEODIST

?
1
GEODIST key member1 member2 [unit]

返回兩個給定位置之間的距離。如果兩個位置之間的其中一個不存在, 那么命令返回空值。指定單位的參數 unit 必須是以下單位的其中一個:(默認為m)

m   表示單位為米。
km  表示單位為千米。
mi  表示單位為英里。
ft  表示單位為英尺。

?
1
2
redis> GEODIST Sicily Palermo Catania
"166274.15156960039"

4.GEORADIUS

?
1
GEORADIUS key longitude latitude radius m|km|ft|mi [WITHCOORD] [WITHDIST] [WITHHASH] [ASC|DESC] [COUNT count]

以給定的經緯度為中心, 返回鍵包含的位置元素當中, 與中心的距離不超過給定最大距離的所有位置元素。距離單位和上面的一致,其中后面的選項:

WITHDIST: 在返回位置元素的同時, 將位置元素與中心之間的距離也一並返回。距離的單位和用戶給定的范圍單位保持一致。
WITHCOORD: 將位置元素的經度和維度也一並返回。
WITHHASH: 以 52 位有符號整數的形式, 返回位置元素經過原始 geohash 編碼的有序集合分值。這個選項主要用於底層應用或者調試, 實際中的作用並不大。

?
1
2
3
4
5
redis> GEORADIUS Sicily 15 37 200 km WITHDIST
1) 1) "Palermo"
  2) "190.4424"
2) 1) "Catania"
  2) "56.4413"

HyperLogLog

Redis 的基數統計,這個結構可以非常省內存的去統計各種計數,比如注冊 IP 數、每日訪問 IP 數、頁面實時UV)、在線用戶數等。但是它也有局限性,就是只能統計數量,而沒辦法去知道具體的內容是什么。

當然用集合也可以解決這個問題。但是一個大型的網站,每天 IP 比如有 100 萬,粗算一個 IP 消耗 15 字節,那么 100 萬個 IP 就是 15M。而 HyperLogLog 在 Redis 中每個鍵占用的內容都是 12K,理論存儲近似接近 2^64 個值,不管存儲的內容是什么,它一個基於基數估算的算法,只能比較准確的估算出基數,可以使用少量固定的內存去存儲並識別集合中的唯一元素。而且這個估算的基數並不一定准確,是一個帶有 0.81% 標准錯誤的近似值。

這個數據結構的命令有三個:PFADD、PFCOUNT、PFMERGE

1.PFADD

?
1
2
3
4
5
redis> PFADD databases "Redis" "MongoDB" "MySQL"
(integer) 1
 
redis> PFADD databases "Redis"  # Redis 已經存在,不必對估計數量進行更新
(integer) 0

2.PFCOUNT

?
1
2
redis> PFCOUNT databases
(integer) 3

3.PFMERGE

?
1
PFMERGE destkey sourcekey [sourcekey ...]

將多個 HyperLogLog 合並為一個 HyperLogLog, 合並后的 HyperLogLog 的基數接近於所有輸入 HyperLogLog 的可見集合的並集。合並得出的 HyperLogLog 會被儲存在 destkey 鍵里面, 如果該鍵並不存在,那么命令在執行之前, 會先為該鍵創建一個空的 HyperLogLog 。

?
1
2
3
4
5
6
7
8
redis> PFADD nosql "Redis" "MongoDB" "Memcached"
(integer) 1
redis> PFADD RDBMS "MySQL" "MSSQL" "PostgreSQL"
(integer) 1
redis> PFMERGE databases nosql RDBMS
OK
redis> PFCOUNT databases
(integer) 6

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM