10.Redis的RDB和AOF兩種持久化機制的優劣勢對比


1、RDB和AOF兩種持久化機制的介紹

2、RDB持久化機制的優點
3、RDB持久化機制的缺點
4、AOF持久化機制的優點
5、AOF持久化機制的缺點
6、RDB和AOF到底該如何選擇

我們已經知道對於一個企業級的redis架構來說,持久化是不可減少的

企業級redis集群架構:海量數據、高並發、高可用

持久化主要是做災難恢復,數據恢復,也可以歸類到高可用的一個環節里面去

比如你redis整個掛了,然后redis就不可用了,你要做的事情是讓redis變得可用,盡快變得可用

重啟redis,盡快讓它對外提供服務,但是就像上一講說,如果你沒做數據備份,這個時候redis啟動了,也不可用啊,數據都沒了

很可能說,大量的請求過來,緩存全部無法命中,在redis里根本找不到數據,這個時候就死定了,緩存雪崩問題,所有請求,沒有在redis命中,就會去mysql數據庫這種數據源頭中去找,一下子mysql承接高並發,然后就掛了

mysql掛掉,你都沒法去找數據恢復到redis里面去,redis的數據從哪兒來?從mysql來。。。

具體的完整的緩存雪崩的場景,還有企業級的解決方案,到后面講

如果你把redis的持久化做好,備份和恢復方案做到企業級的程度,那么即使你的redis故障了,也可以通過備份數據,快速恢復,一旦恢復立即對外提供服務

redis的持久化,跟高可用,是有關系的,企業級redis架構中去講解

redis持久化:RDB,AOF

RDB 數據丟失問題,如下圖

 

-------------------------------------------------------------------------------------

1、RDB和AOF兩種持久化機制的介紹

RDB持久化機制,對redis中的數據執行周期性的持久化

AOF機制對每條寫入命令作為日志,以append-only的模式寫入一個日志文件中,在redis重啟的時候,可以通過回放AOF日志中的寫入指令來重新構建整個數據集

如果我們想要redis僅僅作為純內存的緩存來用,那么可以禁止RDB和AOF所有的持久化機制

通過RDB或AOF,都可以將redis內存中的數據給持久化到磁盤上面來,然后可以將這些數據備份到別的地方去,比如說阿里雲,雲服務

如果redis掛了,服務器上的內存和磁盤上的數據都丟了,可以從雲服務上拷貝回來之前的數據,放到指定的目錄中,然后重新啟動redis,redis就會自動根據持久化數據文件中的數據,去恢復內存中的數據,繼續對外提供服務

如果同時使用RDB和AOF兩種持久化機制,那么在redis重啟的時候,會使用AOF來重新構建數據,因為AOF中的數據更加完整

-------------------------------------------------------------------------------------

2、RDB持久化機制的優點

(1)RDB會生成多個數據文件,每個數據文件都代表了某一個時刻中redis的數據,這種多個數據文件的方式,非常適合做冷備,可以將這種完整的數據文件發送到一些遠程的安全存儲上去,比如說Amazon的S3雲服務上去,在國內可以是阿里雲的ODPS分布式存儲上,以預定好的備份策略來定期備份redis中的數據

RDB也可以做冷備,生成多個文件,每個文件都代表了某一個時刻的完整的數據快照
AOF也可以做冷備,只有一個文件,但是你可以,每隔一定時間,去copy一份這個文件出來

RDB做冷備,優勢在哪兒呢?由redis去控制固定時長生成快照文件的事情,比較方便; AOF,還需要自己寫一些腳本去做這個事情,各種定時
RDB數據做冷備,在最壞的情況下,提供數據恢復的時候,速度比AOF快

(2)RDB對redis對外提供的讀寫服務,影響非常小,可以讓redis保持高性能,因為redis主進程只需要fork一個子進程,讓子進程執行磁盤IO操作來進行RDB持久化即可

RDB,每次寫,都是直接寫redis內存,只是在一定的時候,才會將數據寫入磁盤中
AOF,每次都是要寫文件的,雖然可以快速寫入os cache中,但是還是有一定的時間開銷的,速度肯定比RDB略慢一些

(3)相對於AOF持久化機制來說,直接基於RDB數據文件來重啟和恢復redis進程,更加快速

AOF,存放的指令日志,做數據恢復的時候,其實是要回放和執行所有的指令日志,來恢復出來內存中的所有數據的
RDB,就是一份數據文件,恢復的時候,直接加載到內存中即可

結合上述優點,RDB特別適合做冷備份,冷備

-------------------------------------------------------------------------------------

3、RDB持久化機制的缺點

(1)如果想要在redis故障時,盡可能少的丟失數據,那么RDB沒有AOF好。一般來說,RDB數據快照文件,都是每隔5分鍾,或者更長時間生成一次,這個時候就得接受一旦redis進程宕機,那么會丟失最近5分鍾的數據

這個問題,也是rdb最大的缺點,就是不適合做第一優先的恢復方案,如果你依賴RDB做第一優先恢復方案,會導致數據丟失的比較多

(2)RDB每次在fork子進程來執行RDB快照數據文件生成的時候,如果數據文件特別大,可能會導致對客戶端提供的服務暫停數毫秒,或者甚至數秒

一般不要讓RDB的間隔太長,否則每次生成的RDB文件太大了,對redis本身的性能可能會有影響的

-------------------------------------------------------------------------------------

4、AOF持久化機制的優點

(1)AOF可以更好的保護數據不丟失,一般AOF會每隔1秒,通過一個后台線程執行一次fsync操作,最多丟失1秒鍾的數據

每隔1秒,就執行一次fsync操作,保證os cache中的數據寫入磁盤中

redis進程掛了,最多丟掉1秒鍾的數據

(2)AOF日志文件以append-only模式寫入,所以沒有任何磁盤尋址的開銷,寫入性能非常高,而且文件不容易破損,即使文件尾部破損,也很容易修復

(3)AOF日志文件即使過大的時候,出現后台重寫操作,也不會影響客戶端的讀寫。因為在rewrite log的時候,會對其中的指導進行壓縮,創建出一份需要恢復數據的最小日志出來。再創建新日志文件的時候,老的日志文件還是照常寫入。當新的merge后的日志文件ready的時候,再交換新老日志文件即可。

(4)AOF日志文件的命令通過非常可讀的方式進行記錄,這個特性非常適合做災難性的誤刪除的緊急恢復。比如某人不小心用flushall命令清空了所有數據,只要這個時候后台rewrite還沒有發生,那么就可以立即拷貝AOF文件,將最后一條flushall命令給刪了,然后再將該AOF文件放回去,就可以通過恢復機制,自動恢復所有數據


-------------------------------------------------------------------------------------

5、AOF持久化機制的缺點

(1)對於同一份數據來說,AOF日志文件通常比RDB數據快照文件更大

(2)AOF開啟后,支持的寫QPS會比RDB支持的寫QPS低,因為AOF一般會配置成每秒fsync一次日志文件,當然,每秒一次fsync,性能也還是很高的

如果你要保證一條數據都不丟,也是可以的,AOF的fsync設置成沒寫入一條數據,fsync一次,那就完蛋了,redis的QPS大降

(3)以前AOF發生過bug,就是通過AOF記錄的日志,進行數據恢復的時候,沒有恢復一模一樣的數據出來。所以說,類似AOF這種較為復雜的基於命令日志/merge/回放的方式,比基於RDB每次持久化一份完整的數據快照文件的方式,更加脆弱一些,容易有bug。不過AOF就是為了避免rewrite過程導致的bug,因此每次rewrite並不是基於舊的指令日志進行merge的,而是基於當時內存中的數據進行指令的重新構建,這樣健壯性會好很多。

(4)唯一的比較大的缺點,其實就是做數據恢復的時候,會比較慢,還有做冷備,定期的備份,不太方便,可能要自己手寫復雜的腳本去做,做冷備不太合適


-------------------------------------------------------------------------------------

6、RDB和AOF到底該如何選擇

(1)不要僅僅使用RDB,因為那樣會導致你丟失很多數據

(2)也不要僅僅使用AOF,因為那樣有兩個問題,第一,你通過AOF做冷備,沒有RDB做冷備,來的恢復速度更快; 第二,RDB每次簡單粗暴生成數據快照,更加健壯,可以避免AOF這種復雜的備份和恢復機制的bug

(3)綜合使用AOF和RDB兩種持久化機制,用AOF來保證數據不丟失,作為數據恢復的第一選擇; 用RDB來做不同程度的冷備,在AOF文件都丟失或損壞不可用的時候,還可以使用RDB來進行快速的數據恢復


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM