上一篇文章我寫了koa-static的源碼解析,其中用到了HTTP
的緩存策略,給返回的靜態文件設置了一些緩存的頭,比如Cache-Control
之類的。於是我就跟朋友討論了一下HTTP
的緩存策略:
朋友說:“HTTP
里面控制緩存的頭(header
)太多了,啥Cache-Control
,ETag
,Last-Modified
,一大堆,亂七八糟的,而且之間邏輯關系不強,要掌握基本靠背!”
我有點驚訝:“為什么要去背這個呢?所有的技術都是為了解決問題而存在的,不了解問題而去單純的學習技術,去,背,去,死記,確實很枯燥,而且效果不好。HTTP
緩存策略只是為了解決客戶端和服務端信息不對稱的問題而存在的,客戶端為了加快速度會緩存部分資源,但是下次請求時,客戶端不知道這個資源有沒有更新,服務端也不知道客戶端緩存的是哪個版本,不知道該不該再返回資源,其實就是一個信息同步問題,HTTP
緩存策略就是來解決這個問題的。如果我們跳出這種純粹的技術思維,我們會發現生活中這種信息同步問題也很常見。而我們解決這些問題的思路很多時候都是司空見慣了,如果從這個角度來說,這個問題就很好理解!”
於是我給他講了一個我小時候租光碟看奧特曼的故事。
租光碟看奧特曼
事情是這樣的,我小時候特別喜歡看動畫片,尤其是奧特曼,但是那時候沒有電腦啊,也沒有網絡。我只有一台DVD播放機,於是我會經常跑去租光碟的店租奧特曼。
ETag
某天,我看完了《艾斯奧特曼》第10集,我還想繼續看。於是我找到了光碟店的老板:“老板,第10集我看完了哦,你還有沒有新的啊?”老板說:“有有有,剛出了第11集,你拿去吧!”
上面這一個簡單的交流過程其實就包含了一個HTTP
的緩存技術,那就是ETag
!類比於網絡請求,我其實就是客戶端,光碟店就是服務端,我去租光碟就相當於發起一個請求。但是我去租光碟時,老板並不知道我看到哪集了,我們的信息是不同步的。所以我告訴了他一個標記(Tag
),在這里這個標記就是第10集,老板拿到這個標記,跟他自己庫存的標記比較一下,發現他最新標記是第11集,於是知道有更新了,將第11集給了我。
Last-Modified & If-Modified-Since
再來,我《艾斯奧特曼》看完了,我開始看《泰羅奧特曼》了。可是老板這次比較雞賊,《泰羅奧特曼》沒買正版的,是他自己翻錄的,他翻錄的時候自己也不知道是第幾集,但是他聰明的在光盤上寫上了翻錄日期。於是我正在看的這盤也沒啥封面,只光禿禿的寫了一個2000年12月1日。當我這盤看完了,我又去找老板了:“老板,你這個2000年12月1日的我已經看完了,你還有沒有新的啊?”這里的2000年12月1日其實就是標記了我手上副本的更新日期,這也對應了HTTP
的一個緩存技術,那就是Last-Modified
和If-Modified-Since
。你可以理解為,老板給日期還取了一個名字,叫Last-Modified
,所以光碟上完整文字是Last-Modified:2000年12月1日
,而我去問的時候就這么問:“Do you have any updates IF-Modified-Since 2000年12月1日?”。
Expires和Max-Age
繼續,我《泰羅奧特曼》也看完了,開始看《雷歐奧特曼》了。這《雷歐奧特曼》跟前面兩個都不一樣,我去租的時候老板就說了:“你小子別天天跑來問了!《雷歐奧特曼》我每周去進一次貨,你每周一來拿就行!”這句話也對應了一個HTTP
緩存技術,那就是Expires
和Max-Age
。我知道了下周一之前,我手上都是最新的,到了下周一就過期(Expire
)了。所以“我手上的是最新的”這個說法有個生命周期,他的年齡是有限的,他的年齡等於下周一更新時間減去當前時間,這就是他的最大年齡(Max-Age
)。
Immutable
再來一個,我《雷歐奧特曼》也看完了,開始看《奈克斯特奧特曼》了。這《奈克斯特奧特曼》跟前面幾個都不一樣,我去租的時候老板說了:“小子,你這次運氣好,這《奈克斯特奧特曼》已經出完了,你全部拿去吧,也不用天天跑來問了!”這句話對應的HTTP
緩存技術是啥?當然是Immutable!Immutable
就跟字面意思一樣,不可變的!就像《奈克斯特奧特曼》一樣,已經出完了,不用再去問更新了。
言歸正傳
扯蛋到這里結束,咱們言歸正傳!之所以舉這么個例子,是為了說明HTTP
緩存技術要解決的問題在生活中很常見,從這些常見的場景入手,理解起來更簡單。下面我們正兒八經的來說說HTTP
緩存技術:
兩種機制
從上面的幾個小例子可以看出,有時候為了知道是不是有更新,我必須去問老板,比如第一個例子里面:“老板,第10集我看完了哦,你還有沒有新的啊?”。這種為了知道有沒有更新,必須跟服務端溝通過才知道的,我們稱之為協商緩存。還有些場景,我不去問就知道有沒有更新,比如第三個例子,因為知道是周更的,當周一來之前,我都不會去問了,到了周一再去問,這種不用跟服務器協商直接用本地副本的叫做強制緩存。換成技術的話說就是,強制緩存不用發請求直接用本地緩存,協商緩存要發請求去問服務器有沒有更新。下面我們詳細來講下這兩種緩存:
協商緩存
前面第一個例子和第二個例子每次都需要向服務器端詢問,所以是協商緩存。
ETag和If-None-Match
ETag
是URL的Entity Tag
,就是一個URL資源的標識符,類似於文件的md5
,計算方式也類似,當服務器返回時,可以根據返回內容計算一個hash
值或者就是一個數字版本號,類似於我們的第10集
,具體返回什么值要看服務器的計算策略。然后將它加到response
的header
里面,可能長這樣:
ETag: "33a64df551425fcc55e4d42a148795d9f25f89d4"
客戶端拿到后會將這個ETag
和返回值一起存下來,等下次請求時,使用配套的If-None-Match
,將這個放到request
的header
里面,可能長這樣:
If-None-Match: "33a64df551425fcc55e4d42a148795d9f25f89d4"
然后服務端拿到請求里面的If-None-Match
跟當前版本的ETag
比較下:
- 如果是一樣的話,直接返回
304
,語義為Not Modified
,不返回內容(body
),只返回header
,告訴瀏覽器直接用緩存。 - 如果不一樣的話,返回
200
和最新的內容
與ETag
配套的還有一個不太常用的request header
----If-Match
,這個和前面If-None-Match
的語義是相反的。前面If-None-Match
的語義是如果不匹配就下載。而If-Match
通常用於post
或者put
請求中,語義為如果匹配才提交,比如你在編輯一個商品,其他人也可能同時在編輯。當你提交編輯時,其他人可能已經先於你提交了,這時候服務端的ETag
就已經變了,If-Match
就不成立了,這時候服務端會給你返回412
錯誤,也就是Precondition Failed
,前提條件失敗。如果If-Match
成立,就正常返回200
。
Last-Modified & If-Modified-Since
Last-Modified
和If-Modified-Since
也是配套使用的,類似於ETag
和If-None-Match
的關系。只不過ETag
放的是一個版本號或者hash
值,Last-Modified
放的是資源的最后修改時間。Last-Modified
是放到response
的header
里面的,可能長這樣:
Last-Modified: Wed, 21 Oct 2000 07:28:00 GMT
而客戶端瀏覽器在使用時,應該將配套的If-Modified-Since
放到request
的header
里面,長這樣:
If-Modified-Since: Wed, 21 Oct 2000 07:28:00 GMT
服務端拿到這個頭后,會跟當前版本的修改時間進行比較:
- 當前版本的修改時間比這個晚,也就是這個時間后又改過了,返回
200
和新的內容 - 當前版本的修改時間和這個一樣,也就是沒有更新,返回
304
,不返回內容,只返回頭,客戶端直接使用緩存
與If-Modified-Since
對應的還有If-Unmodified-Since
,If-Modified-Since
可以理解為有更新才下載,那If-Unmodified-Since
就是沒有更新才下載。如果客戶端傳了If-Unmodified-Since
,像這樣:
If-Unmodified-Since: Wed, 21 Oct 2000 07:28:00 GMT
服務端拿到這個頭后,也會跟當前版本的修改時間進行比較:
- 如果這個時間后沒有更新,服務器返回
200
,並返回內容。 - 如果這個時間后有更新,其實就是這個
if
不成立,會返回錯誤代碼412
,語義為Precondition Failed
ETag和Last-Modified優先級
ETag
和Last-Modified
都是協商緩存,都需要服務器進行計算和比較,那如果這兩個都存在,用哪個呢?答案是ETag
,ETag
的優先級比Last-Modified
高。因為Last-Modified
在設計上有個問題,那就是Last-Modified
的精度只能到秒,如果一個資源頻繁修改,在同一秒進行多次修改,你從Last-Modified
上是看不出來區別的。但是ETag
每次修改都會生成新的,所以他比Last-Modified
精度高,更准確。但是ETag
也不是完全沒問題的,你的ETag
如果設計為一個hash
值,每次請求都要計算這個值,需要額外耗費服務器資源。具體使用哪一個,需要根據自己的項目情況來進行取舍。
強制緩存
上面扯蛋那里的第三個例子和第四個例子就是強制緩存,就是我知道在某個時間段完全不用去問服務端,直接去用緩存就行。這兩個例子里面提到的Expires
是一個單獨的header
,max-age
和immutable
同屬於Cache-Control
這個header
。
Expires
Expires
比較簡單,就是服務器response
的header
帶上這個字段:
Expires: Wed, 21 Oct 2000 07:28:00 GMT
然后在這個時間前,客戶端瀏覽器都不會再發起請求,而是直接用緩存資源。
Cache-Control
Cache-Control
相對比較復雜,可設置屬性也比較多,max-age
只是其中一個屬性,長這樣:
Cache-Control: max-age=20000
這表示當前資源在20000秒
內都不用再請求了,直接使用緩存。
上面提到的immutable
也是Cache-Control
的一個屬性,但是是個實驗性質的,各個瀏覽器兼容並不好。設置了Cache-control: immutable
表示這輩子都用緩存了,再請求是不可能的了。
其他常用屬性還有:
no-cache
:使用緩存前,強制要求把請求提交給服務器進行驗證(協商緩存驗證)。
no-store
:不存儲有關客戶端請求或服務器響應的任何內容,即不使用任何緩存。
另外Cache-Control
還有很多屬性,大家可以參考MDN的文檔。
Expires和Cache-Control的優先級
就一句話:如果在Cache-Control
響應頭設置了 max-age
或者 s-maxage
指令,那么 Expires
頭會被忽略。
協商緩存和強制緩存優先級
這個其實很好理解,協商緩存需要發請求跟服務器協商,強制緩存如果生效,根本就不會發請求。所以這個優先級就是:先判斷強制緩存,如果強制緩存生效,直接使用緩存;如果強制緩存失效,再發請求跟服務器協商,看要不要使用緩存。
總結
本文從生活中常見的場景入手,闡述了HTTP
緩存機制其實是提高訪問速度和解決信息不同步的一種機制。這種信息不同步在生活中很常見,很多解決思路我們已經司空見慣,帶着這種思維,我們可以很好的理解HTTP
緩存機制。HTTP
緩存機制要點如下:
HTTP
緩存機制分為強制緩存和協商緩存兩類。- 強制緩存的意思就是不要問了(不發起請求),直接用緩存吧。
- 強制緩存常見技術有
Expires
和Cache-Control
。 Expires
的值是一個時間,表示這個時間前緩存都有效,都不需要發起請求。Cache-Control
有很多屬性值,常用屬性max-age
設置了緩存有效的時間長度,單位為秒
,這個時間沒到,都不用發起請求。immutable
也是Cache-Control
的一個屬性,表示這個資源這輩子都不用再請求了,但是他兼容性不好,Cache-Control
其他屬性可以參考MDN的文檔。Cache-Control
的max-age
優先級比Expires
高。- 協商緩存常見技術有
ETag
和Last-Modified
。 ETag
其實就是給資源算一個hash
值或者版本號,對應的常用request header
為If-None-Match
。Last-Modified
其實就是加上資源修改的時間,對應的常用request header
為If-Modified-Since
,精度為秒
。ETag
每次修改都會改變,而Last-Modified
的精度只到秒
,所以ETag
更准確,優先級更高,但是需要計算,所以服務端開銷更大。- 強制緩存和協商緩存都存在的情況下,先判斷強制緩存是否生效,如果生效,不用發起請求,直接用緩存。如果強制緩存不生效再發起請求判斷協商緩存。
參考資料:
ETag MDN
文檔:https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Headers/ETag
Last-Modified MDN
文檔:https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Headers/Last-Modified
Expires MDN
文檔:https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Headers/Expires
Cache-Control MDN
文檔:https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Headers/Cache-Control
文章的最后,感謝你花費寶貴的時間閱讀本文,如果本文給了你一點點幫助或者啟發,請不要吝嗇你的贊和GitHub小星星,你的支持是作者持續創作的動力。
歡迎關注我的公眾號進擊的大前端第一時間獲取高質量原創~
“前端進階知識”系列文章:https://juejin.im/post/5e3ffc85518825494e2772fd
“前端進階知識”系列文章源碼GitHub地址: https://github.com/dennis-jiang/Front-End-Knowledges