文章原創於公眾號:程序猿周先森。本平台不定時更新,喜歡我的文章,歡迎關注我的微信公眾號。
可能談到保持Redis與Mysql雙庫的數據一致性,可能很多人最先想到的方案就是讀請求和寫請求串行化,串到一個內存隊列里去。但是這個方案有着一個致命的缺點:讀請求和寫請求串行化會導致系統的吞吐量大幅度降低,需要使用比正常情況下多幾倍的機器去支撐線上的一個請求。Redis與Mysql雙庫的數據一致性問題為何會出現呢?其實我們可以考慮這么一個業務場景:我們需要更新部分數據,我們首先更新數據庫數據,然后清除Redis緩存中的數據。但是數據庫更新操作成功了,然而Redis清除緩存出現異常了,這樣會導致出現這么一種情況:數據庫中的數據已經更新為最新數據,但是Redis緩存中的數據依舊還是老數據,這時候就會出現Redis與Mysql雙庫的數據一致性問題。
有些喜歡投機取巧的朋友就會想,那我先清掉緩存中的舊數據,然后再寫入新數據到數據庫,最后更新緩存不就可以了么?這種方式可能出現一種問題:我們清除Redis緩存成功了,但是寫入還未將新數據寫入到數據庫之前有讀請求的發生,就會導致數據庫中的舊數據再次存入Redis中,然后等到新數據寫入到數據庫后,一樣產生了。Redis與Mysql雙庫的數據一致性問題。
昨天談到Redis分布式環境其實有說到,分布式環境下,數據讀寫操作是並發操作,所以導致對用一份數據進行讀寫操作先后執行順序無法保證,所以就可能出現讀操作先於寫操作被執行,這時就會出現臟數據導致數據一致性問題的產生。這時候我們需要考慮我們讀取的數據是否是強一致性數據,比如賬戶余額這種必須是強一致性數據,則讀數據庫,如果讀取的數據實時性沒有非常嚴格,比如積分排行榜等,就可以直接讀取Redis數據。如果機器並發量不高的情況下,讀取數據優先從Redis中讀取,緩存中數據不存在才選擇從數據庫中獲取,並且把從數據庫獲取到的數據寫入Redis。寫入數據則相反,先清除Redis緩存數據,再寫入數據到數據庫,如果是簡單數據這時候可以實時寫入到Redis中供讀操作讀取,如果是需要多表連表查詢的數據,則可以暫時不寫入Redis,等到有查詢操作的時候再寫入到Redis。
那如果是高並發的情況下呢?在高並發的情況下,讀取數據操作和上面是一樣,優先從Redis讀取。但是寫入數據操作就和剛才做法不一樣了,高並發的情況下,寫入數據先寫入到Redis,然后定期從Redis寫入到Mysql中。高並發的情況下需要注意的是,每個讀取數據的請求都需要在超時時間內返回數據,如果數據更新很頻繁,可能會導致Redis積壓了一系列更新操作,從而導致大量的讀取數據請求超時,最后這大量的讀取數據請求全部壓到數據庫,導致緩存擊穿的現象產生,嚴重可能導致數據庫宕機。這時候解決方案其實一般通過增加機器來增加吞吐量,或者暫時先返回一個老數據給客戶端。
所以到這里我們其實方案很明確了,一共有兩種比較常見的方案:Redis是作為緩存服務器使用,一般作為緩存有兩個用途:請求快速處理和減少I/O頻率。減少I/O頻率實際上就是剛才所說的高並發情況下數據實時寫入到數據庫,然后數據積累到一定程度定期寫入到數據庫,請求快速處理就是處理讀請求時有限從Redis中獲取,Redis是支持高並發操作的,所以處理速度很快,如果Redis中不存在數據,再去數據庫中查詢,然后寫入到redis中緩存,以便二次讀取可以直接從緩存中取到數據。
第二種方案其實就是異步異步緩存,Redis緩存熱門數據,增刪改查都在Mysql操作,只要Mysql有insert、update、delete操作,可以通過kafka或者rabbitMQ等第三方消息推送工具將binlog相關的消息推送到Redis中,Redis解析binlog中的數據對Redis緩存中的數據進行更新,Mysql中的主從備份機制也是通過binlog來實現數據一致性的。
本文由博客一文多發平台 OpenWrite 發布!