《【面試突擊】— Redis篇》-- Redis哨兵原理及持久化機制

本文轉載自查看原文 2020-01-18 23:22 1148 面試/ Redis/ 持久化

能堅持別人不能堅持的，才能擁有別人未曾擁有的。
關注編程大道公眾號，讓我們一同堅持心中所想，一起成長！！

《【面試突擊】— Redis篇》-- Redis哨兵原理及持久化機制

在這個系列里，我會整理一些面試題與大家分享，幫助年后和我一樣想要在金三銀四准備跳槽的同學。
我們一起鞏固、突擊面試官常問的一些面試題，加油！！

《【面試突擊】— Redis篇》--Redis數據類型？適用於哪些場景？

《【面試突擊】— Redis篇》--Redis的線程模型了解嗎？為啥單線程效率還這么高？

《【面試突擊】— Redis篇》-- Redis的主從復制？哨兵機制？

前兩次因為時間原因面試官暫時中止了面試，覺得上次你對redis的主從復制，哨兵機制的知識掌握的還可以，於是今天面試官想看看你到底對Redis了解有多深，又加大了攻勢，你准備好了嗎？

上次因為時間問題面試草草收場今天我還有幾個哨兵的問題要問。首先說一下Redis Sentinel是怎么工作的？重點描述一下故障轉移的過程

好的。

1)每個Sentinel以每秒鍾一次的頻率向它所知的Master，Slave以及其他 Sentinel 實例發送一個 PING 命令。

2)如果一個實例（instance）距離最后一次有效回復 PING 命令的時間超過 down-after-milliseconds 選項所指定的值，則這個實例會被當前 Sentinel 標記為主觀下線。

3)如果一個Master被標記為主觀下線，則正在監視這個Master的所有 Sentinel 要以每秒一次的頻率確認Master的確進入了主觀下線狀態。

4)當有足夠數量的 Sentinel（大於等於配置文件指定的值）在指定的時間范圍內確認Master的確進入了主觀下線狀態，則Master會被標記為客觀下線。

5)當Master被 Sentinel 標記為客觀下線時，Sentinel 向下線的 Master 的所有 Slave 發送 INFO 命令的頻率會從 10 秒一次改為每秒一次（在一般情況下，每個 Sentinel 會以每 10 秒一次的頻率向它已知的所有Master，Slave發送 INFO 命令）。

6)若沒有足夠數量的 Sentinel 同意 Master 已經下線， Master 的客觀下線狀態就會變成主觀下線。若 Master 重新向 Sentinel 的 PING 命令返回有效回復， Master 的主觀下線狀態就會被移除。

7）sentinel節點會與其他sentinel節點進行“溝通”，投票選舉一個sentinel節點進行故障處理，在從節點中選取一個主節點，其他從節點掛載到新的主節點上自動復制新主節點的數據。

故障轉移時會從剩下的slave選舉一個新的master，被選舉為master的標准是什么？

如果一個master被認為odown了，而且majority哨兵都允許了主備切換，那么某個哨兵就會執行主備切換操作，此時首先要選舉一個slave來，會考慮slave的一些信息。
（1）跟master斷開連接的時長。
如果一個slave跟master斷開連接已經超過了down-after-milliseconds的10倍，外加master宕機的時長，那么slave就被認為不適合選舉為master.

( down-after-milliseconds * 10) + milliseconds_since_master_is_in_SDOWN_state

（2）slave優先級。
按照slave優先級進行排序，slave priority越低，優先級就越高

（3）復制offset。
如果slave priority相同，那么看replica offset，哪個slave復制了越多的數據，offset越靠后，優先級就越高

（4）run id
如果上面兩個條件都相同，那么選擇一個run id比較小的那個slave

執行切換的那個哨兵在完成故障轉移后會做什么？

會進行configuraiton配置信息傳播。

哨兵完成切換之后，會在自己本地更新生成最新的master配置，然后通過pub/sub消息機制同步給其他的哨兵。

同步配置的時候其他哨兵根據什么更新自己的配置呢？

執行切換的那個哨兵，會從要切換到的新master（salve->master）那里得到一個configuration epoch，這就是一個version號，每次切換的version號都必須是唯一的。

如果第一個選舉出的哨兵切換失敗了，那么其他哨兵，會等待failover-timeout時間，然后接替繼續執行切換，此時會重新獲取一個新的configuration epoch 作為新的version號。

這個version號就很重要了，因為各種消息都是通過一個channel去發布和監聽的，所以一個哨兵完成一次新的切換之后，新的master配置是跟着新的version號的，其他的哨兵都是根據版本號的大小來更新自己的master配置的。

好，上次哨兵的問題暫時就到這吧，接下來說說redis的持久化方面的問題吧。首先，生產上Redis要不要持久化？如果要，說說為什么需要，或者說持久化對生產系統的意義何在？

要。

redis持久化主要是做災難恢復，數據恢復，也可以歸類到高可用的范疇。

比如Redis整個掛了，導致Redis不可用了，這時候首先要做的事情是讓Redis盡快變得可用。那么就會去重啟Redis，盡快讓它對外提供服務。但是如果沒做持久化沒有數據備份，這個時候Redis啟動了，也不可用啊，數據都沒了！

這時候很可能，大量的請求過來，在緩存全部無法命中，這個時候就死定了，可能會導致緩存雪崩問題，所有的請求，沒有在Redis命中，就會去數據庫中去找，數據庫一下子承接高並發，然后就掛了。數據庫掛掉，你都沒法去找數據恢復到redis里面去。

Redis持久化機制有哪些？

Redis有兩種持久化機制，AOF和RDB。

AOF，記錄每次寫請求的命令，以追加的方式在文件尾部追加，直接在尾部追加，效率比較高。
對於操作系統來說，不是每次寫都直接寫到磁盤，操作系統自己會有一層cache，redis寫磁盤的數據會先緩存在os cache里，redis每隔1秒調用一次操作系統的fsync操作，強制將os cache中的數據刷入AOF文件中。

當redis重啟的時候，就把AOF中記錄的命令重新執行一遍就可以了，但是如果文件很大的話，執行會耗費較多的時間，對於數據恢復來說耗時會多一點。

RDB，是快照文件，每隔一定時間將redis內存中的數據生成一份完整的RDB快照文件，當redis重啟的時候直接加載數據即可，同樣的數據比AOF恢復的要快。

說說這兩種持久化機制各自的特點、優缺點吧

好的。
RDB的優點
第一點就是他會生成多個數據文件，每個數據文件都代表了某一時刻redis中的數據，非常適合做冷備。
第二點，RDB持久化機制對redis對外提供的讀寫服務影響非常小，可以讓redis保持高性能，因為redis主進程只需要fork一個子進程，讓子進程執行磁盤IO操作來進行RDB持久化即可。
第三點，相對於AOF持久化機制來說，直接基於RDB數據文件來重啟和恢復redis進程，更加快速。

AOF，存放的指令日志，做數據恢復的時候，其實是要回放和執行所有的指令日志，來恢復出來內存中的所有數據的。

RDB，就是一份數據文件，恢復的時候，直接加載到內存中即可。

RBD的缺點
1）故障時可能數據丟失的比AOF要多。
一般來說，RDB數據快照文件，都是每隔5分鍾或者更長時間生成一次，這個時候一旦redis進程宕機，那么會丟失最近5分鍾的數據。

這個問題，也是rdb最大的缺點，就是不適合做第一優先的恢復方案，如果你依賴RDB做第一優先恢復方案，會導致數據丟失的比較多

2）RDB每次在fork子進程來執行RDB快照數據文件生成的時候，如果數據文件特別大，可能會導致對客戶端提供的服務暫停數毫秒，或者甚至數秒。

所以一般不要讓RDB的間隔太長，否則每次生成的RDB文件太大了，對redis本身的性能可能會有影響的。

AOF的優點

1）AOF可以更好的保護數據不丟失
一般AOF會每隔1秒，通過一個后台線程執行一次fsync操作，最多丟失1秒鍾的數據。

每隔1秒，就執行一次fsync操作，保證os cache中的數據寫入磁盤中。
redis進程掛了，最多丟掉1秒鍾的數據.

2）AOF持久化性能高
AOF日志文件以append-only模式寫入，所以沒有任何磁盤尋址的開銷，寫入性能非常高，而且文件不容易破損，即使文件尾部破損，也很容易修復。

3）AOF日志文件即使過大的時候，出現后台重寫操作，也不會影響客戶端的讀寫。
因為在rewrite log的時候，會對其中的指令進行壓縮，創建出一份需要恢復數據的最小日志出來。再創建新日志文件的時候，老的日志文件還是照常寫入。當新的merge后的日志文件ready的時候，再交換新老日志文件即可。

4）AOF日志文件的命令通過非常可讀的方式進行記錄，這個特性非常適合做災難性的誤刪除的緊急恢復。

比如某人不小心用flushall命令清空了所有數據，只要這個時候后台rewrite還沒有發生，那么就可以立即拷貝AOF文件，將最后一條flushall命令給刪了，然后再將該AOF文件放回去，就可以通過恢復機制，自動恢復所有數據。

AOF的缺點

（1）對於同一份數據來說，AOF日志文件通常比RDB數據快照文件更大

（2）AOF開啟后，支持的寫QPS會比RDB支持的寫QPS低，因為AOF一般會配置成每秒fsync一次日志文件，當然，每秒一次fsync，性能也還是很高的。

如果你要保證一條數據都不丟，也是可以的，AOF的fsync設置成沒寫入一條數據，fsync一次，但是那樣導致redis的QPS大幅度下降。

（3）以前AOF發生過bug，就是通過AOF記錄的日志，進行數據恢復的時候，沒有恢復一模一樣的數據出來。

所以說，類似AOF這種較為復雜的基於命令日志/merge/回放的方式，比基於RDB每次持久化一份完整的數據快照文件的方式，更加脆弱一些，容易有bug。

不過AOF就是為了避免rewrite過程導致的bug，因此每次rewrite並不是基於舊的指令日志進行merge的，而是基於當時內存中的數據進行指令的重新構建，這樣健壯性會好很多。

（4）唯一的比較大的缺點，其實就是做數據恢復的時候，會比較慢，做冷備不太合適。

你剛才提到冷備，那你具體說說為啥AOF不適合RDB適合？

其實兩個都可以做，只不過RDB更適合。

RDB可以做冷備，是因為它會生成多個文件，每個文件都代表了某一個時刻的完整的數據快照，我們可以將這種完整的數據文件發送到一些遠程的安全存儲上去，比如可以是阿里雲的ODPS分布式存儲上，以預定好的備份策略來定期備份redis中的數據。

AOF也可以做冷備，只不過它只有一個文件，但是我們可以去自己寫程序，每隔一定時間，去copy一份這個文件出來。

RDB做冷備，優勢在於由redis去控制固定時長生成快照文件的事情，比較方便，而 AOF，還需要我們自己寫一些腳本去做這個事情，各種定時，比較麻煩。

RDB數據做冷備，在最壞的情況下，提供數據恢復的時候，速度比AOF快。

說了那么多AOF和RDB，那么生產系統對於這倆持久化機制到底該如何選擇呢？

至於，RDB和AOF到底該如何選擇，我覺得兩種都選擇，

1）不要僅僅使用RDB，因為那樣會導致你丟失很多數據。

2）也不要僅僅使用AOF，因為那樣有兩個問題，

第一，你通過AOF做冷備，沒有RDB做冷備，來的恢復速度更快;
第二，RDB每次簡單粗暴生成數據快照，更加健壯，可以避免AOF這種復雜的備份和恢復機制的bug。

3）綜合使用AOF和RDB兩種持久化機制，用AOF來保證數據不丟失，作為數據恢復的第一選擇; 用RDB來做不同程度的冷備，在AOF文件都丟失或損壞不可用的時候，還可以使用RDB來進行快速的數據恢復，作為數據恢復的最后一道防線。

好，今天就到這里，下次我們繼續聊

終於結束了。

其實如果你的簡歷上寫了掌握Redis，那么如果面試官也比較精通Redis的話，他就會抓住你這一個Redis從淺入深的一直追着問，看看你到底對Redis了解多少，是不是平時自己真的積累過這些知識，是不是比別人要懂得多一點，經過一層一層的深挖，看看你能過幾關。相對於其他競爭者可能幾個回合就招架不住了，你要是能多戰幾個回合，面試官對你的印象也會越深，你的機會也就越大。

如果說就redis問你幾個基礎的問題，那面試官要么對redis了解不多，要么就看中了你簡歷中的其他亮點。

本系列文章在於面試突擊，不是教程，要是細挖能講好多，而面試你只需要把這個原理說出來就行了，如果邊講邊畫圖那就更好了。

該系列文章在於快速突擊，快速拾遺，溫習。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 《【面試突擊】— Redis篇》-- Redis的主從復制？哨兵機制？ Redis哨兵機制原理淺談：Redis持久化機制（二）AOF篇淺談：Redis持久化機制（一）RDB篇 redis持久化機制 Redis為什么這么快以及持久化機制 Redis持久化機制 Redis持久化機制 redis持久化機制 Redis 的持久化機制