徹底弄懂HTTP緩存機制及原理


  前言

  Http 緩存機制作為 web 性能優化的重要手段,對於從事 Web 開發的同學們來說,應該是知識體系庫中的一個基礎環節,同時對於有志成為前端架構師的同學來說是必備的知識技能。

  但是對於很多前端同學來說,僅僅只是知道瀏覽器會對請求的靜態文件進行緩存,但是為什么被緩存,緩存是怎樣生效的,卻並不是很清楚。在此,我會嘗試用簡單明了的文字,像大家系統的介紹HTTP緩存機制,期望對各位正確的理解前端緩存有所幫助。

  HTTP報文

  在介紹HTTP緩存之前,作為知識鋪墊,先簡單介紹一下HTTP報文,HTTP報文就是瀏覽器和服務器間通信時發送及響應的數據塊。瀏覽器向服務器請求數據時,發送請求(request)報文;服務器向瀏覽器返回數據時,返回響應(response)報文。

  報文信息主要分為兩部分:

  首部(header)------附加信息(cookie,緩存信息等)與緩存相關的規則信息,均包含在header中;

  主體部分(body)-----HTTP請求真正想要傳輸的部分。

  緩存規則解析

  為方便大家理解,我們認為瀏覽器存在一個緩存數據庫,用於存儲緩存信息。在客戶端第一次請求數據時,此時緩存數據庫中沒有對應的緩存數據,需要請求服務器,服務器返回后,將數據存儲至緩存數據庫中。

  

  HTTP緩存有多種規則,根據是否需要重新向服務器發起請求來分類,我將其分為兩大類(強制緩存,對比緩存)在詳細介紹這兩種規則之前,先通過時序圖的方式,讓大家對這兩種規則有個簡單了解。

  已存在緩存數據時,僅基於強制緩存,請求數據的流程如下:

  

  已存在緩存數據時,僅基於對比緩存,請求數據的流程如下: 

  

  對緩存機制不太了解的同學可能會問,基於對比緩存的流程下,不管是否使用緩存,都需要向服務器發送請求,那么還用緩存干什么?這個問題,我們暫且放下,后文在詳細介紹每種緩存規則的時候,會帶給大家答案。

  我們可以看到兩類緩存規則的不同,強制緩存如果生效,不需要再和服務器發生交互,而對比緩存不管是否生效,都需要與服務端發生交互。兩類緩存規則可以同時存在,強制緩存優先級高於對比緩存,也就是說,當執行強制緩存的規則時,如果緩存生效,直接使用緩存,不再執行對比緩存規則。

  強制緩存

  從上文我們得知,強制緩存,在緩存數據未失效的情況下,可以直接使用緩存數據,那么瀏覽器是如何判斷緩存數據是否失效呢?

  我們知道,在沒有緩存數據的時候,瀏覽器向服務器請求數據時,服務器會將數據和緩存規則一並返回,緩存規則信息包含在響應header中。

  對於強制緩存來說,響應header中會有兩個字段來標明失效規則(Expires/Cache-Control)使用chrome的開發者工具,可以很明顯的看到對於強制緩存生效時,網絡請求的情況:

  

  Expires

  Expires的值為服務端返回的到期時間,即下一次請求時,請求時間小於服務端返回的到期時間,直接使用緩存數據。不過Expires 是HTTP 1.0的東西,現在默認瀏覽器均默認使用HTTP 1.1,所以它的作用基本忽略。

  另一個問題是,到期時間是由服務端生成的,但是客戶端時間可能跟服務端時間有誤差,這就會導致緩存命中的誤差。所以HTTP 1.1 的版本,使用Cache-Control替代。

  Cache-Control

Cache-Control類型 描述
private 客戶端可以緩存
public 客戶端和代理服務器都可緩存(前端的同學,可以認為public和private是一樣的)
max-age=xxx 緩存的內容將在 xxx 秒后失效
no-cache 需要使用對比緩存來驗證緩存數據(后面介紹)
no-store 所有內容都不會緩存,強制緩存,對比緩存都不會觸發(對於前端開發來說,緩存越多越好,so...基本上和它說886)

  舉個板栗: 

  

  圖中Cache-Control僅指定了max-age,所以默認為private,緩存時間為31536000秒(365天)也就是說,在365天內再次請求這條數據,都會直接獲取緩存數據庫中的數據,直接使用。 

  對比緩存

  對比緩存,顧名思義,需要進行比較判斷是否可以使用緩存。瀏覽器第一次請求數據時,服務器會將緩存標識與數據一起返回給客戶端,客戶端將二者備份至緩存數據庫中。再次請求數據時,客戶端將備份的緩存標識發送給服務器,服務器根據緩存標識進行判斷,判斷成功后,返回304狀態碼,通知客戶端比較成功,可以使用緩存數據。

  第一次訪問 

  

  第二次訪問 

  

  通過兩圖的對比,我們可以很清楚的發現,在對比緩存生效時,狀態碼為304,並且報文大小和請求時間大大減少。

  原因是,服務端在進行標識比較后,只返回header部分,通過狀態碼通知客戶端使用緩存,不再需要將報文主體部分返回給客戶端。對於對比緩存來說,緩存標識的傳遞是我們着重需要理解的,它在請求header和響應header間進行傳遞,一共下面幾種傳遞,接下來,我們分開介紹。

  Last-Modified:

  服務器在響應請求時,告訴瀏覽器資源的最后修改時間。

   

  If-Modified-Since:

  再次請求服務器時,那么瀏覽器將在請求中添加參數 If-Modified-Since(值為上次響應里面的Last-Modified值),服務器收到請求后發現有頭If-Modified-Since 則與被請求資源的最后修改時間進行比對。

  若資源的最后修改時間大於If-Modified-Since,說明資源又被改動過,則響應整片資源內容,返回狀態碼200;若資源的最后修改時間小於或等於If-Modified-Since,說明資源無新修改,則響應HTTP 304,告知瀏覽器繼續使用所保存的cache。

  

  Etag:

  服務器響應請求時,告訴瀏覽器當前資源在服務器的唯一標識(生成規則由服務器決定)。

  

  If-None-Match:

  再次請求服務器時,通過此字段通知服務器客戶段緩存數據的唯一標識。服務器收到請求后發現有頭If-None-Match 則與被請求資源的唯一標識進行比對,不同,說明資源又被改動過,則響應整片資源內容,返回狀態碼200;相同,說明資源無新修改,則響應HTTP 304,告知瀏覽器繼續使用所保存的cache。

  

  總結:

  對於強制緩存,服務器通知瀏覽器一個緩存時間,在緩存時間內,下次請求,直接用緩存,不在時間內,執行比較緩存策略。

  對於比較緩存,將緩存信息中的Etag和Last-Modified通過請求發送給服務器,由服務器校驗,返回304狀態碼時,瀏覽器直接使用緩存。

                          瀏覽器第一次請求: 

              

                            瀏覽器第二次請求: 

            

  參考鏈接:https://mp.weixin.qq.com/s?__biz=MzIwNTc4NTEwOQ==&mid=2247484185&idx=1&sn=6f39d612bc70ef9e8cde3827b0321163&chksm=972ad263a05d5b75eb51541722a82e421e67a22a4efc2a981d8c29710b52f3acf438680a97a5&mpshare=1&scene=23&srcid=12126dKlCJhAOvNFGvrBdoWy#rd

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM