Redis 官方在 2020 年 5 月正式推出 6.0 版本,提供很多振奮人心的新特性,所以備受關注。
碼老濕,提供了啥特性呀?知道了我能加薪么?
主要特性如下:
- 多線程處理網絡 IO;
- 客戶端緩存;
- 細粒度權限控制(ACL);
RESP3
協議的使用;- 用於復制的 RDB 文件不在有用,將立刻被刪除;
- RDB 文件加載速度更快;
其中備受關注的就是「多線程模型 + 客戶端緩存」,我們只有掌握了新特性原理,才能判斷什么時候使用 6.0 版本,如何用的更好更快,不踩坑。
本篇先從 Redis 多線程模型開始,至於客戶端緩存、等且聽下回分解。
最后,點擊下方卡片關注「碼哥字節」能加薪。
碼老濕,Redis 6.0 之前為什么不使用多線程?
官方答復:
-
使用 Redis 時,幾乎不存在 CPU 成為瓶頸的情況, Redis 主要受限於內存和網絡。
-
在一個普通的 Linux 系統上,Redis 通過使用
pipelining
每秒可以處理 100 萬個請求,所以如果應用程序主要使用 O(N) 或O(log(N)) 的命令,它幾乎不會占用太多 CPU。 -
使用了單線程后,可維護性高。多線程模型雖然在某些方面表現優異,但是它卻引入了程序執行順序的不確定性,帶來了並發讀寫的一系列問題,增加了系統復雜度、同時可能存在線程切換、甚至加鎖解鎖、死鎖造成的性能損耗。
Redis 通過 AE 事件模型以及 IO 多路復用等技術,處理性能非常高,因此沒有必要使用多線程。
單線程機制讓 Redis 內部實現的復雜度大大降低,Hash 的惰性 Rehash、Lpush 等等『線程不安全』的命令都可以無鎖進行。
在《Redis 為什么這么快?》碼哥有詳細介紹快的原理。
Redis 6.0 之前單線程指的是 Redis 只有一個線程干活么?
非也,Redis 在處理客戶端的請求時,包括獲取 (socket 讀)、解析、執行、內容返回 (socket 寫) 等都由一個順序串行的主線程處理,這就是所謂的「單線程」。
其中執行命令階段,由於 Redis 是單線程來處理命令的,所有每一條到達服務端的命令不會立刻執行,所有的命令都會進入一個 Socket 隊列中,當 socket 可讀則交給單線程事件分發器逐個被執行。
此外,有些命令操作可以用后台線程或子進程執行(比如數據刪除、快照生成、AOF 重寫)。
碼老濕,那 Redis 6.0 為啥要引入多線程呀?
隨着硬件性能提升,Redis 的性能瓶頸可能出現網絡 IO 的讀寫,也就是:單個線程處理網絡讀寫的速度跟不上底層網絡硬件的速度。
讀寫網絡的 read/write
系統調用占用了Redis 執行期間大部分CPU 時間,瓶頸主要在於網絡的 IO 消耗, 優化主要有兩個方向:
- 提高網絡 IO 性能,典型的實現比如使用
DPDK
來替代內核網絡棧的方式。 - 使用多線程充分利用多核,提高網絡請求讀寫的並行度,典型的實現比如
Memcached
。
添加對用戶態網絡協議棧的支持,需要修改 Redis 源碼中和網絡相關的部分(例如修改所有的網絡收發請求函數),這會帶來很多開發工作量。
而且新增代碼還可能引入新 Bug,導致系統不穩定。
所以,Redis 采用多個 IO 線程來處理網絡請求,提高網絡請求處理的並行度。
需要注意的是,Redis 多 IO 線程模型只用來處理網絡讀寫請求,對於 Redis 的讀寫命令,依然是單線程處理。
這是因為,網絡處理經常是瓶頸,通過多線程並行處理可提高性能。
而繼續使用單線程執行讀寫命令,不需要為了保證 Lua 腳本、事務、等開發多線程安全機制,實現更簡單。
架構圖如下:
主線程與 IO 多線程是如何實現協作呢?
如下圖:
主要流程:
- 主線程負責接收建立連接請求,獲取
socket
放入全局等待讀處理隊列; - 主線程通過輪詢將可讀
socket
分配給 IO 線程; - 主線程阻塞等待 IO 線程讀取
socket
完成; - 主線程執行 IO 線程讀取和解析出來的 Redis 請求命令;
- 主線程阻塞等待 IO 線程將指令執行結果回寫回
socket
完畢; - 主線程清空全局隊列,等待客戶端后續的請求。
思路:將主線程 IO 讀寫任務拆分出來給一組獨立的線程處理,使得多個 socket 讀寫可以並行化,但是 Redis 命令還是主線程串行執行。
如何開啟多線程呢?
Redis 6.0 的多線程默認是禁用的,只使用主線程。如需開啟需要修改 redis.conf
配置文件:io-threads-do-reads yes
。
碼老濕,線程數是不是越多越好?
當然不是,關於線程數的設置,官方有一個建議:4 核的機器建議設置為 2 或 3 個線程,8核的建議設置為 6 個線程,線程數一定要小於機器核數。
線程數並不是越大越好,官方認為超過了 8 個基本就沒什么意義了。
另外,開啟多線程后,還需要設置線程數,否則是不生效的。
io-threads 4
總結與思考
隨着互聯網的飛速發展,互聯網業務系統所要處理的線上流量越來越大,Redis 的單線程模式會導致系統消耗很多 CPU 時間在網絡 I/O 上從而降低吞吐量,要提升 Redis 的性能有兩個方向:
- 優化網絡 I/O 模塊
- 提高機器內存讀寫的速度
后者依賴於硬件的發展,暫時無解。所以只能從前者下手,網絡 I/O 的優化又可以分為兩個方向:
- 零拷貝技術或者 DPDK 技術
- 利用多核優勢
模型缺陷
Redis 的多線程網絡模型實際上並不是一個標准的 Multi-Reactors/Master-Workers 模型,Redis 的多線程方案中,I/O 線程任務僅僅是通過 socket 讀取客戶端請求命令並解析,卻沒有真正去執行命令。
所有客戶端命令最后還需要回到主線程去執行,因此對多核的利用率並不算高,而且每次主線程都必須在分配完任務之后忙輪詢等待所有 I/O 線程完成任務之后才能繼續執行其他邏輯。
在我看來,Redis 目前的多線程方案更像是一個折中的選擇:既保持了原系統的兼容性,又能利用多核提升 I/O 性能。