1、面試題
redis和memcached有什么區別?
redis的線程模型是什么?
為什么單線程的redis比多線程的memcached效率要高得多(為什么redis是單線程的但是還可以支撐高並發)?
2、面試官心里分析
這個是問redis的時候,最基本的問題吧,redis最基本的一個內部原理和特點,就是redis實際上是個單線程工作模型,你要是這個都不知道,那后面玩兒redis的時候,出了問題豈不是什么都不知道?
還有可能面試官會問問你redis和memcached的區別,不過說實話,最近這兩年,我作為面試官都不太喜歡這么問了,memched是早些年各大互聯網公司常用的緩存方案,但是現在近幾年基本都是redis,沒什么公司用memcached了
3、面試題剖析
(1)redis和memcached有啥區別
- Redis支持服務器端的數據操作:Redis相比Memcached來說,擁有更多的數據結構和並支持更豐富的數據操作,通常在Memcached里,你需要將數據拿到客戶端來進行類似的修改再set回去。這大大增加了網絡IO的次數和數據體積。在Redis中,這些復雜的操作通常和一般的GET/SET一樣高效。所以,如果需要緩存能夠支持更復雜的結構和操作,那么Redis會是不錯的選擇。
-
集群模式:memcached沒有原生的集群模式,需要依靠客戶端來實現往集群中分片寫入數據;但是redis目前是原生支持cluster模式的,redis官方就是支持redis cluster集群模式的,比memcached來說要更好
(2)redis的線程模型
- 文件事件處理器
redis基於reactor模式開發了網絡事件處理器,這個處理器叫做文件事件處理器,file event handler。這個文件事件處理器,是單線程的,redis才叫做單線程的模型,采用IO多路復用機制同時監聽多個socket,根據socket上的事件來選擇對應的事件處理器來處理這個事件。
如果被監聽的socket准備好執行accept、read、write、close等操作的時候,跟操作對應的文件事件就會產生,這個時候文件事件處理器就會調用之前關聯好的事件處理器來處理這個事件。
文件事件處理器是單線程模式運行的,但是通過IO多路復用機制監聽多個socket,可以實現高性能的網絡通信模型,又可以跟內部其他單線程的模塊進行對接,保證了redis內部的線程模型的簡單性。
文件事件處理器的結構包含4個部分:多個socket,IO多路復用程序,文件事件分派器,事件處理器(命令請求處理器、命令回復處理器、連接應答處理器,等等)。
多個socket可能並發的產生不同的操作,每個操作對應不同的文件事件,但是IO多路復用程序會監聽多個socket,但是會將socket放入一個隊列中排隊,每次從隊列中取出一個socket給事件分派器,事件分派器把socket給對應的事件處理器。
然后一個socket的事件處理完之后,IO多路復用程序才會將隊列中的下一個socket給事件分派器。文件事件分派器會根據每個socket當前產生的事件,來選擇對應的事件處理器來處理。
- 文件事件
當socket變得可讀時(比如客戶端對redis執行write操作,或者close操作),或者有新的可以應答的sccket出現時(客戶端對redis執行connect操作),socket就會產生一個AE_READABLE事件。
當socket變得可寫的時候(客戶端對redis執行read操作),socket會產生一個AE_WRITABLE事件。
IO多路復用程序可以同時監聽AE_REABLE和AE_WRITABLE兩種事件,要是一個socket同時產生了AE_READABLE和AE_WRITABLE兩種事件,那么文件事件分派器優先處理AE_REABLE事件,然后才是AE_WRITABLE事件。
- 文件事件處理器
如果是客戶端要連接redis,那么會為socket關聯連接應答處理器
如果是客戶端要寫數據到redis,那么會為socket關聯命令請求處理器
如果是客戶端要從redis讀數據,那么會為socket關聯命令回復處理器
- 客戶端與redis通信的一次流程
在redis啟動初始化的時候,redis會將連接應答處理器跟AE_READABLE事件關聯起來,接着如果一個客戶端跟redis發起連接,此時會產生一個AE_READABLE事件,然后由連接應答處理器來處理跟客戶端建立連接,創建客戶端對應的socket,同時將這個socket的AE_READABLE事件跟命令請求處理器關聯起來。
當客戶端向redis發起請求的時候(不管是讀請求還是寫請求,都一樣),首先就會在socket產生一個AE_READABLE事件,然后由對應的命令請求處理器來處理。這個命令請求處理器就會從socket中讀取請求相關數據,然后進行執行和處理。
接着redis這邊准備好了給客戶端的響應數據之后,就會將socket的AE_WRITABLE事件跟命令回復處理器關聯起來,當客戶端這邊准備好讀取響應數據時,就會在socket上產生一個AE_WRITABLE事件,會由對應的命令回復處理器來處理,就是將准備好的響應數據寫入socket,供客戶端來讀取。
命令回復處理器寫完之后,就會刪除這個socket的AE_WRITABLE事件和命令回復處理器的關聯關系。
(3)為啥redis單線程模型也能效率這么高?
1)純內存操作
2)核心是基於非阻塞的IO多路復用機制
3)單線程反而避免了多線程的頻繁上下文切換問題(百度)