徹底弄懂HTTP緩存機制及原理

本文轉載自查看原文 2018-05-06 19:44 1688 網絡技術/ Http緩存

　　前言

　　Http 緩存機制作為 web 性能優化的重要手段，對於從事 Web 開發的同學們來說，應該是知識體系庫中的一個基礎環節，同時對於有志成為前端架構師的同學來說是必備的知識技能。

　　但是對於很多前端同學來說，僅僅只是知道瀏覽器會對請求的靜態文件進行緩存，但是為什么被緩存，緩存是怎樣生效的，卻並不是很清楚。在此，我會嘗試用簡單明了的文字，像大家系統的介紹HTTP緩存機制，期望對各位正確的理解前端緩存有所幫助。

　　HTTP報文

　　在介紹HTTP緩存之前，作為知識鋪墊，先簡單介紹一下HTTP報文，HTTP報文就是瀏覽器和服務器間通信時發送及響應的數據塊。瀏覽器向服務器請求數據時，發送請求(request)報文；服務器向瀏覽器返回數據時，返回響應(response)報文。

　　報文信息主要分為兩部分：

　　首部(header)------附加信息（cookie，緩存信息等）與緩存相關的規則信息，均包含在header中；

　　主體部分(body)-----HTTP請求真正想要傳輸的部分。

　　緩存規則解析

　　為方便大家理解，我們認為瀏覽器存在一個緩存數據庫,用於存儲緩存信息。在客戶端第一次請求數據時，此時緩存數據庫中沒有對應的緩存數據，需要請求服務器，服務器返回后，將數據存儲至緩存數據庫中。

　　HTTP緩存有多種規則，根據是否需要重新向服務器發起請求來分類，我將其分為兩大類(強制緩存，對比緩存)在詳細介紹這兩種規則之前，先通過時序圖的方式，讓大家對這兩種規則有個簡單了解。

　　已存在緩存數據時，僅基於強制緩存，請求數據的流程如下：

　　已存在緩存數據時，僅基於對比緩存，請求數據的流程如下：

　　對緩存機制不太了解的同學可能會問，基於對比緩存的流程下，不管是否使用緩存，都需要向服務器發送請求，那么還用緩存干什么？這個問題，我們暫且放下，后文在詳細介紹每種緩存規則的時候，會帶給大家答案。

　　我們可以看到兩類緩存規則的不同，強制緩存如果生效，不需要再和服務器發生交互，而對比緩存不管是否生效，都需要與服務端發生交互。兩類緩存規則可以同時存在，強制緩存優先級高於對比緩存，也就是說，當執行強制緩存的規則時，如果緩存生效，直接使用緩存，不再執行對比緩存規則。

　　強制緩存

　　從上文我們得知，強制緩存，在緩存數據未失效的情況下，可以直接使用緩存數據，那么瀏覽器是如何判斷緩存數據是否失效呢？

　　我們知道，在沒有緩存數據的時候，瀏覽器向服務器請求數據時，服務器會將數據和緩存規則一並返回，緩存規則信息包含在響應header中。

　　對於強制緩存來說，響應header中會有兩個字段來標明失效規則（Expires/Cache-Control）使用chrome的開發者工具，可以很明顯的看到對於強制緩存生效時，網絡請求的情況：

　　Expires

　　Expires的值為服務端返回的到期時間，即下一次請求時，請求時間小於服務端返回的到期時間，直接使用緩存數據。不過Expires 是HTTP 1.0的東西，現在默認瀏覽器均默認使用HTTP 1.1，所以它的作用基本忽略。

　　另一個問題是，到期時間是由服務端生成的，但是客戶端時間可能跟服務端時間有誤差，這就會導致緩存命中的誤差。所以HTTP 1.1 的版本，使用Cache-Control替代。

　　Cache-Control

Cache-Control類型	描述
private	客戶端可以緩存
public	客戶端和代理服務器都可緩存（前端的同學，可以認為public和private是一樣的）
max-age=xxx	緩存的內容將在 xxx 秒后失效
no-cache	需要使用對比緩存來驗證緩存數據（后面介紹）
no-store	所有內容都不會緩存，強制緩存，對比緩存都不會觸發（對於前端開發來說，緩存越多越好，so...基本上和它說886）

　　舉個板栗：

　　圖中Cache-Control僅指定了max-age，所以默認為private，緩存時間為31536000秒（365天）也就是說，在365天內再次請求這條數據，都會直接獲取緩存數據庫中的數據，直接使用。

　　對比緩存

　　對比緩存，顧名思義，需要進行比較判斷是否可以使用緩存。瀏覽器第一次請求數據時，服務器會將緩存標識與數據一起返回給客戶端，客戶端將二者備份至緩存數據庫中。再次請求數據時，客戶端將備份的緩存標識發送給服務器，服務器根據緩存標識進行判斷，判斷成功后，返回304狀態碼，通知客戶端比較成功，可以使用緩存數據。

　　第一次訪問

　　第二次訪問

　　通過兩圖的對比，我們可以很清楚的發現，在對比緩存生效時，狀態碼為304，並且報文大小和請求時間大大減少。

　　原因是，服務端在進行標識比較后，只返回header部分，通過狀態碼通知客戶端使用緩存，不再需要將報文主體部分返回給客戶端。對於對比緩存來說，緩存標識的傳遞是我們着重需要理解的，它在請求header和響應header間進行傳遞，一共下面幾種傳遞，接下來，我們分開介紹。

　　Last-Modified：

　　服務器在響應請求時，告訴瀏覽器資源的最后修改時間。

　　If-Modified-Since：

　　再次請求服務器時，那么瀏覽器將在請求中添加參數 If-Modified-Since（值為上次響應里面的Last-Modified值），服務器收到請求后發現有頭If-Modified-Since 則與被請求資源的最后修改時間進行比對。

　　若資源的最后修改時間大於If-Modified-Since，說明資源又被改動過，則響應整片資源內容，返回狀態碼200；若資源的最后修改時間小於或等於If-Modified-Since，說明資源無新修改，則響應HTTP 304，告知瀏覽器繼續使用所保存的cache。

　　Etag：

　　服務器響應請求時，告訴瀏覽器當前資源在服務器的唯一標識（生成規則由服務器決定）。

　　If-None-Match：

　　再次請求服務器時，通過此字段通知服務器客戶段緩存數據的唯一標識。服務器收到請求后發現有頭If-None-Match 則與被請求資源的唯一標識進行比對，不同，說明資源又被改動過，則響應整片資源內容，返回狀態碼200；相同，說明資源無新修改，則響應HTTP 304，告知瀏覽器繼續使用所保存的cache。

　　總結：

　　對於強制緩存，服務器通知瀏覽器一個緩存時間，在緩存時間內，下次請求，直接用緩存，不在時間內，執行比較緩存策略。

　　對於比較緩存，將緩存信息中的Etag和Last-Modified通過請求發送給服務器，由服務器校驗，返回304狀態碼時，瀏覽器直接使用緩存。

　　　　　　　　　　　　　　　　　　　　　　　　　　瀏覽器第一次請求：

　　　　　　　　　　　　　　　　　　　　　　　　　　　　瀏覽器第二次請求：

　　參考鏈接：https://mp.weixin.qq.com/s?__biz=MzIwNTc4NTEwOQ==&mid=2247484185&idx=1&sn=6f39d612bc70ef9e8cde3827b0321163&chksm=972ad263a05d5b75eb51541722a82e421e67a22a4efc2a981d8c29710b52f3acf438680a97a5&mpshare=1&scene=23&srcid=12126dKlCJhAOvNFGvrBdoWy#rd

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 徹底弄懂HTTP緩存機制及原理 Http協議：徹底弄懂 Http 緩存機制 - 基於緩存策略三要素分解法面試總被問到HTTP緩存機制及原理？看完你就徹底明白了徹底理解瀏覽器的緩存機制（http緩存機制）徹底弄懂jQuery事件原理一徹底弄懂強緩存與協商緩存徹底弄懂 Laravel 中間件原理 20 張圖讓你徹底弄懂 HTTPS 原理! 徹底弄懂jsonp原理及實現方法這一次，徹底弄懂 Promise 原理