什么是緩存?
緩存就是數據交換的緩沖區,用於臨時存儲數據(使用頻繁的數據)。當用戶請求數據時,首先在緩存中尋找,如果找到了則直接返回。如果找不到,則去數據庫中查找。緩存的本質就是用空間換時間,犧牲數據的實時性,從而減輕數據庫壓力,盡可能提高吞吐量,有效提升響應速度。
緩存的分類
緩存的應用范圍十分廣泛,常見的有文件緩存、瀏覽器緩存、數據庫緩存等等。但今天我們着重關注的是 WEB 應用服務領域,根據緩存與應用的耦合度,可以分為本地緩存和分布式緩存:
-
本地緩存
指在應用中的緩存組件,最大的優點是應用和緩存是在同一個進程內部,請求緩存速度快;同時,它的缺點也是因為緩存跟應用程序耦合,多個應用程序無法直接共享緩存,各應用或集群的各節點都需要維護自己的單獨緩存
-
分布式緩存
指的是與應用分離的緩存組件或服務,最大的優點是自身就是一個獨立的應用,與本地應用隔離,多個應用可直接共享緩存
緩存的特點
緩存也是一個數據模型對象,那么必然有它的一些特征:
-
命中率
命中率 = 返回正確結果數 / 請求緩存次數,命中率問題是緩存中的一個非常重要的問題,它是衡量緩存有效性的重要指標。命中率越高,表明緩存的使用率越高。
-
最大元素
緩存中可以存放的最大元素的數量,一旦緩存中元素數量超過這個值,將會觸發緩存清空策略。根據不同的場景合理設置最大元素值,可以在一定程度上提高緩存的命中率,從而更有效的利用緩存。
緩存清空策略
緩存的存儲空間有限制,當緩存空間被用滿時,就需要緩存清空策略來處理。常見的一般策略有:
-
先進先出策略
先進入緩存的數據,在緩存空間不足時會被優先被清理掉,以騰出新的空間接受新的數據。先進先出策略主要比較緩存元素的創建時間,在數據實效性要求較高的場景下可選擇該類策略,優先保障最新數據可用
-
最少使用策略
無論是否過期,根據元素被使用的次數判斷,清除使用次數較少的元素。最少使用策略主要比較元素的命中次數,在保證高頻數據有效性場景下,可選擇該類策略
-
最近最少使用策略
無論是否過期,根據元素最后一次被使用的時間戳,清除最遠使用時間戳的元素。策略算法主要比較元素最近一次被使用的時間。適用於熱點數據場景,優先保證熱點數據的有效性
此外,還有一些簡單策略,比如:
- 根據過期時間判斷,清理過期時間最長的元素
- 根據過期時間判斷,清理最近要過期的元素
- 隨機清理
- 根據關鍵字(或元素內容)清理等等
Redis 實現分布式緩存
可以利用 Mybatis 自帶的本地緩存,結合 Redis 實現分布式緩存。主要思路是將 Mybatis 二級緩存的存放地點從本地改為配置了 Redis 的遠程服務器。
第一步,創建一個 SpringBoot 工程,整合 MyBatis 和 Redis,在 Mapper 文件中加入 <cache/> 標簽開啟二級緩存。
<cache/> 標簽默認采用 PrepetualCache,該類是 Cache 接口的實現類,維護一個 Map 來保存數據。我們要作改造,就要自定義一個實現類並替換 <cache type="xxxx.RedisCache">

實現自定義 RedisCache
public class RedisCache implements Cache {
// 當前放入緩存的 mapper 的 namespace,也是緩存的唯一標識
private final String id;
public RedisCache(String id) {
System.out.println("id:" + id);
this.id = id;
}
/**
* 返回 cache 的唯一標識
*/
@Override
public String getId() {
return this.id;
}
/**
* 緩存放入值
*/
@Override
public void putObject(Object key, Object value) {
System.out.println("放入緩存");
// 通過工具類獲取 redisTemplate
RedisTemplate redisTemplate = getRedisTemplate();
// 使用 redishash 類型作為緩存存儲模型
redisTemplate.opsForHash().put(id.toString(), key.toString(), value);
}
/**
* 獲取緩存中的值
*/
@Override
public Object getObject(Object key) {
System.out.println("獲得緩存");
// 通過工具類獲取 redisTemplate
RedisTemplate redisTemplate = getRedisTemplate();
// 根據 key 從 redis 的 hash 類型中獲取數據
return redisTemplate.opsForHash().get(id.toString(), key.toString());
}
/**
* 根據指定的 key 刪除緩存
* 該方法為 mybatis 保留方法,默認沒有實現
*/
@Override
public Object removeObject(Object key) {
System.out.println("根據指定的 key 刪除緩存");
return null;
}
@Override
public void clear() {
System.out.println("清空緩存");
// 通過工具類獲取 redisTemplate
RedisTemplate redisTemplate = getRedisTemplate();
// 清空 namespace
redisTemplate.delete(id.toString());
}
/**
* 計算緩存數量
*/
@Override
public int getSize() {
RedisTemplate redisTemplate = getRedisTemplate();
return redisTemplate.opsForHash().size(id.toString()).intValue();
}
/**
* 獲取 redisTemplate
*/
private RedisTemplate getRedisTemplate() {
RedisTemplate redisTemplate = (RedisTemplate) ApplicationContextUtils.getBean("redisTemplate");
redisTemplate.setKeySerializer(new StringRedisSerializer());
redisTemplate.setHashKeySerializer(new StringRedisSerializer());
return redisTemplate;
}
}
到此為止,使用 Redis 實現分布式緩存的目標就完成了。還有一點要注意的是,涉及到多表查詢時,結果會包含另一個表的對象信息。由於 Mybatis 二級緩存清理只會清理自身 namespace 的緩存,所以被包含的對象信息不會被清理。如果此時表信息發生改變,將導致數據不一致。解決辦法是每個 namespace 都使用同一個緩存
<!-- 共享其他 namespace 的緩存 -->
<cache-ref namespace="..."/>
緩存穿透(擊穿)
客戶端查詢了一個數據庫中沒有的數據,導致緩存在這種情況下無法利用(數據庫都沒有則緩存更不可能有了)。此情況下可繞過緩存直接攻擊數據庫。
對於這種惡意訪問,一種思路是先做校驗,對惡意數據直接過濾掉,不要發送至數據庫層;第二種思路是緩存空結果,就是對查詢不存在的數據也記錄在緩存中,這樣就可以有效的減少查詢數據庫的次數。MyBatis 正是使用了第二種方式。
緩存雪崩
在系統運行的某一時刻,緩存全部失效,恰好這一時刻涌來大量客戶端請求,導致數據庫阻塞或掛起。導致緩存失效的原因有很多,常見的是緩存到了失效時間(所有的緩存設置了同樣的過期時間),而沒有作合適的處理。
要解決這個問題,一種方式是設置緩存永久存儲(不推薦),另一種方式是針對不同業務數據設置不同的超時時間,防止集體失效。
