1 RDB和AOF兩種持久化機制的介紹
- RDB持久化就是對redis中的數據執行周期性的數據快照備份,這個周期可以自己配置。
- AOF持久化機制對每條寫入命令都以append-only的模式寫入一個日志文件中,在redis重啟的時候,可以通過回放AOF日志中的寫入指令來重新構建整個數據集,append-only可以配置異步或同步。
- 如果我們想要redis僅僅作為純內存的緩存來用,那么可以禁止RDB和AOF所有的持久化機制。
- 通過RDB或AOF,都可以將redis內存中的數據給持久化到磁盤上面來,然后可以將這些數據備份到別的地方去,比如說阿里雲,雲服務,如果redis掛了,服務器上的內存和磁盤上的數據都丟了,可以從雲服務上拷貝回來之前的數據,放到指定的目錄中,然后重新啟動redis,redis就會自動根據持久化數據文件中的數據,去恢復內存中的數據,繼續對外提供服務。
- 如果同時使用RDB和AOF兩種持久化機制,那么在redis重啟的時候,會使用AOF來重新構建數據,因為AOF中的數據更加完整,所以要想使用RDB快照恢復數據,必須先把AOF關閉。
2 RDB持久化的優點
-
RDB會生成多個數據文件,每個數據文件都代表了某一個時刻中redis的數據,這種多個數據文件的方式,非常適合做冷備,可以將這種完整的數據文件發送到一些遠程的安全存儲上去,比如說Amazon的S3雲服務上去,在國內可以是阿里雲的ODPS分布式存儲上,以預定好的備份策略來定期備份redis中的數據。
- RDB也可以做冷備,生成多個文件,每個文件都代表了某一個時刻的完整的數據快照
- AOF也可以做冷備,只有一個文件,但是你可以,每隔一定時間,去copy一份這個文件出來
- RDB做冷備,優勢在哪兒呢?一、由redis去控制固定時長生成快照文件的事情,比較方便; AOF,還需要自己寫一些腳本去做這個事情,各種定時。二、RDB數據做冷備,在最壞的情況下提供數據恢復的速度也比AOF快。
-
RDB對redis對外提供的讀寫服務,影響非常小,可以讓redis保持高性能,因為redis主進程只需要fork一個子進程,讓子進程執行磁盤IO操作來進行RDB持久化即可。
- RDB,每次寫,都是直接寫redis內存,只是在一定的時候,才會將數據寫入磁盤中
- AOF,每次都是要寫文件的,雖然可以快速寫入os cache中,但是還是有一定的時間開銷的,速度肯定比RDB略慢一些
-
相對於AOF持久化機制來說,直接基於RDB數據文件來重啟和恢復redis進程,更加快速。
- AOF,存放的指令日志,做數據恢復的時候,其實是要回放和執行所有的指令日志,來恢復出來內存中的所有數據的
- RDB,就是一份數據文件,恢復的時候,直接加載到內存中即可
3 RDB持久化的缺點
-
如果想要在redis故障時,盡可能少的丟失數據,那么RDB沒有AOF好。一般來說,RDB數據快照文件,都是每隔5分鍾,或者更長時間生成一次,這個時候就得接受一旦redis進程宕機,那么會丟失最近5分鍾的數據。
這個問題,也是rdb最大的缺點,就是不適合做第一優先的恢復方案,如果你依賴RDB做第一優先恢復方案,會導致數據丟失的比較多
-
RDB每次在fork子進程來執行RDB快照數據文件生成的時候,如果數據文件特別大,可能會導致對客戶端提供的服務暫停數毫秒,或者甚至數秒。
一般不要讓RDB的間隔太長,否則每次生成的RDB文件太大了,對redis本身的性能可能會有影響的
4 AOF持久化的優點
- AOF可以更好的保護數據不丟失,一般AOF會每隔1秒,通過一個后台線程執行一次fsync操作,最多丟失1秒鍾的數據
- AOF日志文件以append-only模式寫入,所以沒有任何磁盤尋址的開銷,寫入性能非常高,而且文件不容易破損,即使文件尾部破損,也很容易修復
- AOF日志文件即使過大的時候,出現后台重寫操作,也不會影響客戶端的讀寫。因為在rewrite log的時候,會對其中的指令進行壓縮,創建出一份需要恢復數據的最小日志出來。再創建新日志文件的時候,老的日志文件還是照常寫入。當新的merge后的日志文件ready的時候,再交換新老日志文件即可。
- AOF日志文件的命令通過非常可讀的方式進行記錄,這個特性非常適合做災難性的誤刪除的緊急恢復。比如某人不小心用flushall命令清空了所有數據,只要這個時候后台rewrite還沒有發生,那么就可以立即拷貝AOF文件,將最后一條flushall命令給刪了,然后再將該AOF文件放回去,就可以通過恢復機制,自動恢復所有數據
5 AOF持久化的缺點
- 對於同一份數據來說,AOF日志文件通常比RDB數據快照文件更大
-
AOF開啟后,支持的寫QPS會比RDB支持的寫QPS低,因為AOF一般會配置成每秒fsync一次日志文件,當然,每秒一次fsync,性能也還是很高的
如果你要保證一條數據都不丟,也是可以的,AOF的fsync設置成沒寫入一條數據,fsync一次,那就完蛋了,redis的QPS大降
-
以前AOF發生過bug,就是通過AOF記錄的日志,進行數據恢復的時候,沒有恢復一模一樣的數據出來。所以說,類似AOF這種較為復雜的基於命令日志/merge/回放的方式,比基於RDB每次持久化一份完整的數據快照文件的方式,更加脆弱一些,容易有bug。不過AOF就是為了避免rewrite過程導致的bug,因此每次rewrite並不是基於舊的指令日志進行merge的,而是基於當時內存中的數據進行指令的重新構建,這樣健壯性會好很多。
- AOF唯一的比較大的缺點就是做數據恢復的時候會比較慢,還有做冷備,定期的備份,不太方便,可能要自己手寫復雜的腳本去做,做冷備不太合適
6 RDB和AOF到底該如何選擇
- 不要僅僅使用RDB,因為那樣會導致你丟失很多數據
- 也不要僅僅使用AOF,因為那樣有兩個問題,第一,你通過AOF做冷備,沒有RDB做冷備,來的恢復速度更快; 第二,RDB每次簡單粗暴生成數據快照,更加健壯,可以避免AOF這種復雜的備份和恢復機制的bug
- 建議同時使用AOF和RDB兩種持久化機制,用AOF來保證數據不丟失,作為數據恢復的第一選擇; 用RDB來做不同程度的冷備,在AOF文件都丟失或損壞不可用的時候,還可以使用RDB來進行快速的數據恢復
7 RDB持久化的配置
redis.conf文件,也就是/etc/redis/6379.conf,去配置持久化
save 60 1000
- 1
- 上面配置的意思是:每隔60s,如果有超過1000個key發生了變更,那么就生成一個新的dump.rdb文件,就是當前redis內存中完整的數據快照,這個操作也被稱之為snapshotting。
- 快照也可以手動調用save或者bgsave命令,同步或異步執行rdb快照生成
- save可以設置多個,就是多個snapshotting檢查點,每到一個檢查點,就會去check一下,是否有指定的key數量發生了變更,如果有,就生成一個新的dump.rdb文件
8 RDB持久化機制的工作流程
- redis根據配置自己嘗試去生成rdb快照文件
- fork一個子進程出來
- 子進程嘗試將數據dump到臨時的rdb快照文件中
- 完成rdb快照文件的生成之后,就替換之前的舊的快照文件
9 AOF持久化的配置
- AOF持久化默認是關閉的(默認是打開RDB持久化),可以通過appendonly yes配置打開AOP持久化
- 在生產環境里面,一般來說AOF都是要打開的,除非你說隨便丟個幾分鍾的數據也無所謂
- 打開AOF持久化機制之后,redis每次接收到一條寫命令,就會寫入日志文件中,當然是先寫入os cache的,然后每隔一定時間再fsync一下
- 即使AOF和RDB都開啟了,redis重啟的時候,也是優先通過AOF進行數據恢復的,因為aof數據比較完整
- 可以配置AOF的fsync策略,有三種策略可以選擇,一種是每次寫入一條數據就執行一次fsync; 一種是每隔一秒執行一次fsync; 一種是不主動執行fsync
always: 每次寫入一條數據,立即將這個數據對應的寫日志fsync到磁盤上去,性能非常非常差,吞吐量很低; 確保說redis里的數據一條都不丟,那就只能這樣了
everysec: 每秒將os cache中的數據fsync到磁盤,這個最常用的,生產環境一般都這么配置,性能很高,QPS還是可以上萬的
no: 僅僅redis負責將數據寫入os cache就撒手不管了,然后后面os自己會時不時有自己的策略將數據刷入磁盤,不可控了
10 AOF rewrite
- redis中的數據其實有限的,很多數據可能會自動過期,可能會被用戶刪除,可能會被redis用緩存清除的算法清理掉,redis中的數據會不斷淘汰掉舊的,就一部分常用的數據會被自動保留在redis內存中,所以可能很多之前的已經被清理掉的數據,對應的寫日志還停留在AOF中,AOF日志文件就一個,會不斷的膨脹,到很大很大,所以AOF會自動在后台每隔一定時間做rewrite操作,比如日志里已經存放了針對100w數據的寫日志了,redis內存只剩下10萬,基於內存中當前的10萬數據構建一套最新的日志,到AOF中; 覆蓋之前的老日志,確保AOF日志文件不會過大,保持跟redis內存數據量一致
- redis 2.4之前,還需要手動,開發一些腳本,crontab,通過BGREWRITEAOF命令去執行AOF rewrite,但是redis 2.4之后,會自動進行rewrite操作
- 在redis.conf中,可以配置rewrite策略
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb
上面配置的解釋:比如說上一次AOF rewrite之后,是128mb,然后就會接着128mb繼續寫AOF的日志,如果發現增長的比例,超過了之前的100%,256mb,就可能會去觸發一次rewrite,但是此時還要去跟min-size,64mb去比較,256mb > 64mb,才會去觸發rewrite
10 AOF rewrite的工作流程
- redis fork一個子進程
- 子進程基於當前內存中的數據,構建日志,開始往一個新的臨時的AOF文件中寫入日志
- redis主進程,接收到client新的寫操作之后,在內存中寫入日志,同時新的日志也繼續寫入舊的AOF文件
- 子進程寫完新的日志文件之后,redis主進程將內存中的新日志再次追加到新的AOF文件中
- 用新的日志文件替換掉舊的日志文件
11 AOF破損文件的修復
如果redis在append數據到AOF文件時,機器宕機了,可能會導致AOF文件破損
用redis-check-aof –fix命令來修復破損的AOF文件
12 AOF和RDB同時工作的情況
- 如果RDB在執行snapshotting操作,那么redis不會執行AOF rewrite; 如果redis再執行AOF rewrite,那么就不會執行RDB snapshotting
- 如果RDB在執行snapshotting,此時用戶執行BGREWRITEAOF命令,那么等RDB快照生成之后,才會去執行AOF rewrite
- 同時開啟RDB和AOF,那么redis重啟的時候,只會使用AOF文件進行數據恢復,如果找不到AOF文件,redis就會認為沒有數據可恢復,會造成數據丟失,所以如果要使用RDB文件進行數據恢復,要先關閉AOF。
