基本介紹
Hash 也可以用來存儲用戶信息,和 String 不同的是 Hash 可以對用戶信息的每個字段單獨存儲,String 則需要序列化用戶的所有字段后存儲.並且 String 需要以整個字符串的形式獲取用戶,而 hash可以只獲取部分數據,從而節約網絡流量.不過 hash 內存占用要大於 String,這是 hash 的缺點.
> hset books JAVA "Effective java" (integer) 1 > hset books golang "concurrency in go" (integer) 1 > hget books java "Effective java" > hset user age 17 (integer) 1 >hincrby user age 1 #單個 key 可以進行計數 和 incr 命令基本一致 (integer) 18
redis 中的 Hash和 Java的 HashMap 更加相似,都是數組+鏈表的結構.當發生 hash 碰撞時將會把元素追加到鏈表上.值得注意的是在 Redis 的 Hash 中 value 只能是字符串.
內部原理
看完基本介紹之后,我們先來了解下 hash 的內部結構.第一維是數組,第二維是鏈表.組成一個 hashtable.
部分源碼:
struct dictht { dictEntry **table; //entry 數組 long size; //數組長度 long used //數組中的元素個數 ... } struct dictEntry{ void *key; //hash 的 key void *val; //hash 的 value dictEntry *next; //下一個dictEntry 鏈表結構 }
在 Java 中 HashMap 擴容是個很耗時的操作,需要去申請新的數組,為了追求高性能,Redis 采用了 漸進式 rehash 策略.這也是 hash 中最重要的部分。
漸進式 rehash
在 hash 的內部包含了兩個hashtable,一般情況下只是用一個.如圖所示:
在擴容的時候 rehash 策略會保留新舊兩個 hashtable 結構,查詢時也會同時查詢兩個 hashtable.Redis會將舊 hashtable 中的內容一點一點的遷移到新的 hashtable 中,當遷移完成時,就會用新的 hashtable 取代之前的.當 hashtable 移除了最后一個元素之后,這個數據結構將會被刪除.如圖所示:
數據搬遷的操作放在 hash 的后續指令中,也就是來自客戶端對 hash 的指令操作.一旦客戶端后續沒有指令操作這個 hash.Redis就會使用定時任務對數據主動搬遷.
正常情況下,當 hashtable 中元素的個數等於數組的長度時,就會開始擴容,擴容的新數組是原數組大小的 2 倍.如果 Redis 正在做 bgsave(持久化) 時,可能不會去擴容,因為要減少內存頁的過多分離(Copy On Write).但是如果 hashtable 已經非常滿了,元素的個數達到了數組長度的 5 倍時,Redis 會強制擴容。
當hashtable 中元素逐漸變少時,Redis 會進行縮容來減少空間占用,並且縮容不會受 bgsave 的影響,縮容條件是元素個數少於數組長度的 10%。