轉自:http://ifeve.com/redis-lru/
本文將介紹Redis在生產環境中使用的Redis的LRU策略,以及自己動手實現的LRU算法(php)
1、設置Redis使用LRU算法
LRU(Least Recently Used)最近最少使用算法是眾多置換算法中的一種。
Redis中有一個maxmemory
概念,主要是為了將使用的內存限定在一個固定的大小。Redis用到的LRU 算法,是一種近似的LRU算法。
(1)設置maxmemory
上面已經說過maxmemory
是為了限定Redis最大內存使用量。有多種方法設定它的大小。其中一種方法是通過CONFIG SET
設定,如下:
1 127.0.0.1:6379> CONFIG GET maxmemory 2 1) "maxmemory" 3 2) "0" 4 127.0.0.1:6379> CONFIG SET maxmemory 100MB 5 OK 6 127.0.0.1:6379> CONFIG GET maxmemory 7 1) "maxmemory" 8 2) "104857600"
另一種方法是修改配置文件redis.conf
:
1 maxmemory 100mb
注意,在64bit系統下,maxmemory
設置為0表示不限制Redis內存使用,在32bit系統下,maxmemory
隱式不能超過3GB。
當Redis內存使用達到指定的限制時,就需要選擇一個置換的策略。
(2)置換策略
當Redis內存使用達到maxmemory
時,需要選擇設置好的maxmemory-policy
進行對老數據的置換。
下面是可以選擇的置換策略:
1 noeviction: 不進行置換,表示即使內存達到上限也不進行置換,所有能引起內存增加的命令都會返回error 2 allkeys-lru: 優先刪除掉最近最不經常使用的key,用以保存新數據 3 volatile-lru: 只從設置失效(expire set)的key中選擇最近最不經常使用的key進行刪除,用以保存新數據 4 allkeys-random: 隨機從all-keys中選擇一些key進行刪除,用以保存新數據 5 volatile-random: 只從設置失效(expire set)的key中,選擇一些key進行刪除,用以保存新數據 6 volatile-ttl: 只從設置失效(expire set)的key中,選出存活時間(TTL)最短的key進行刪除,用以保存新數據
需要注意的是:
(1)設置maxmemory-policy
的方法和設置maxmemory
方法類似,通過redis.conf
或是通過CONFIG SET
動態修改。
(2)如果沒有匹配到可以刪除的key,那么volatile-lru
、volatile-random
和volatile-ttl
策略和noeviction
替換策略一樣——不對任何key進行置換。
(3)選擇合適的置換策略是很重要的,這主要取決於你的應用的訪問模式,當然你也可以動態的修改置換策略,並通過用Redis命令——INFO
去輸出cache的命中率情況,進而可以對置換策略進行調優。
一般來說,有這樣一些常用的經驗:
1 在所有的key都是最近最經常使用,那么就需要選擇allkeys-lru進行置換最近最不經常使用的key,如果你不確定使用哪種策略,那么推薦使用allkeys-lru 2 如果所有的key的訪問概率都是差不多的,那么可以選用allkeys-random策略去置換數據 3 如果對數據有足夠的了解,能夠為key指定hint(通過expire/ttl指定),那么可以選擇volatile-ttl進行置換
volatile-lru
和 volatile-random
經常在一個Redis實例既做cache又做持久化的情況下用到,然而,更好的選擇使用兩個Redis實例來解決這個問題。
設置是失效時間expire
會占用一些內存,而采用allkeys-lru
就沒有必要設置失效時間,進而更有效的利用內存。
(3)置換策略是如何工作的
理解置換策略的執行方式是非常重要的,比如:
1 客戶端執行一條新命令,導致數據庫需要增加數據(比如set key value) 2 Redis會檢查內存使用,如果內存使用超過maxmemory,就會按照置換策略刪除一些key 3 新的命令執行成功
我們持續的寫數據會導致內存達到或超出上限maxmemory
,但是置換策略會將內存使用降低到上限以下。
如果一次需要使用很多的內存(比如一次寫入一個很大的set),那么,Redis的內存使用可能超出最大內存限制一段時間。
(4)近似LRU算法
Redis中的LRU不是嚴格意義上的LRU算法實現,是一種近似的LRU實現,主要是為了節約內存占用以及提升性能。Redis有這樣一個配置——maxmemory-samples
,Redis的LRU是取出配置的數目的key,然后從中選擇一個最近最不經常使用的key進行置換,默認的5,如下:
1 maxmemory-samples 5
可以通過調整樣本數量來取得LRU置換算法的速度或是精確性方面的優勢。
Redis不采用真正的LRU實現的原因是為了節約內存使用。雖然不是真正的LRU實現,但是它們在應用上幾乎是等價的。下圖是Redis的近似LRU實現和理論LRU實現的對比:
測試開始首先在Redis中導入一定數目的key,然后從第一個key依次訪問到最后一個key,因此根據LRU算法第一個被訪問的key應該最新被置換,之后再增加50%數目的key,導致50%的老的key被替換出去。
在上圖中你可以看到三種類型的點,組成三種不同的區域:
1 淡灰色的是被置換出去的key 2 灰色的是沒有被置換出去的key 3 綠色的是新增加的key
理論LRU實現就像我們期待的那樣,最舊的50%數目的key被置換出去,Redis的LRU將一定比例的舊key置換出去。
可以看到在樣本數為5的情況下,Redis3.0要比Redis2.8做的好很多,Redis2.8中有很多應該被置換出去的數據沒有置換出去。在樣本數為10的情況下,Redis3.0很接近真正的LRU實現。
LRU是一個預測未來我們會訪問哪些數據的模型,如果我們訪問數據的形式接近我們預想——冪律,那么近似LRU算法實現將能處理的很好。
在模擬測試中我們可以發現,在冪律訪問模式下,理論LRU和Redis近似LRU的差距很小或者就不存在差距。
如果你將maxmemory-samples
設置為10,那么Redis將會增加額外的CPU開銷以保證接近真正的LRU性能,可以通過檢查命中率來查看有什么不同。
通過CONFIG SET maxmemory-samples <count>
動態調整樣本數大小,做一些測試驗證你的猜想。
2、LRU的實現
1 <?php 2 /** 3 * LRU是最近最少使用頁面置換算法(Least Recently Used),也就是首先淘汰最長時間未被使用的頁面 4 */ 5 class LRU_Cache 6 { 7 8 private $array_lru = array(); 9 private $max_size = 0; 10 11 function __construct($size) 12 { 13 // 緩存最大存儲 14 $this->max_size = $size; 15 } 16 17 public function set_value($key, $value) 18 { 19 // 如果存在,則向隊尾移動,先刪除,后追加 20 // array_key_exists() 函數檢查某個數組中是否存在指定的鍵名,如果鍵名存在則返回true,如果鍵名不存在則返回false。 21 if (array_key_exists($key, $this->array_lru)) { 22 // unset() 銷毀指定的變量。 23 unset($this->array_lru[$key]); 24 } 25 // 長度檢查,超長則刪除首元素 26 if (count($this->array_lru) > $this->max_size) { 27 // array_shift() 函數刪除數組中第一個元素,並返回被刪除元素的值。 28 array_shift($this->array_lru); 29 } 30 // 隊尾追加元素 31 $this->array_lru[$key] = $value; 32 } 33 34 public function get_value($key) 35 { 36 $ret_value = false; 37 38 if (array_key_exists($key, $this->array_lru)) { 39 $ret_value = $this->array_lru[$key]; 40 // 移動到隊尾 41 unset($this->array_lru[$key]); 42 $this->array_lru[$key] = $ret_value; 43 } 44 45 return $ret_value; 46 } 47 48 public function vardump_cache() 49 { 50 echo "<br>"; 51 var_dump($this->array_lru); 52 } 53 } 54 55 $cache = new LRU_Cache(5); // 指定了最大空間 6 56 $cache->set_value("01", "01"); 57 $cache->set_value("02", "02"); 58 $cache->set_value("03", "03"); 59 $cache->set_value("04", "04"); 60 $cache->set_value("05", "05"); 61 $cache->vardump_cache(); 62 echo "<br>"; 63 64 $cache->set_value("06", "06"); 65 $cache->vardump_cache(); 66 echo "<br>"; 67 68 $cache->set_value("03", "03"); 69 $cache->vardump_cache(); 70 echo "<br>"; 71 72 $cache->set_value("07", "07"); 73 $cache->vardump_cache(); 74 echo "<br>"; 75 76 $cache->set_value("01", "01"); 77 $cache->vardump_cache(); 78 echo "<br>"; 79 80 $cache->get_value("04"); 81 $cache->vardump_cache(); 82 echo "<br>"; 83 84 $cache->get_value("05"); 85 $cache->vardump_cache(); 86 echo "<br>"; 87 88 $cache->get_value("10"); 89 $cache->vardump_cache(); 90 echo "<br>";