淺談http中的Cache-Control,cdn緩存加速失敗的原因


原文:

https://blog.csdn.net/u012375924/article/details/82806617

前言
我們用http訪問時,會先發送一個請求,之后服務器返回一個應答,在Chrome的開發者工具(按F12或右擊選擇檢查)中展現了整個過程:

第一部分General是概要,包含請求地址,請求方式,狀態碼,服務器地址以及Referrer 策略。
第二部分是應答頭部,是服務器返回的。
第三部分是請求頭部,是客戶端發送的。

這次我們從兩個角度來看看http的緩存:緩存控制和緩存校驗。
緩存控制:控制緩存的開關,用於標識請求或訪問中是否開啟了緩存,使用了哪種緩存方式。
緩存校驗:如何校驗緩存,比如怎么定義緩存的有效期,怎么確保緩存是最新的。

緩存控制
在http中,控制緩存開關的字段有兩個:Pragma 和 Cache-Control。

Pragma
Pragma有兩個字段Pragma和Expires。Pragma的值為no-cache時,表示禁用緩存,Expires的值是一個GMT時間,表示該緩存的有效時間。
Pragma是舊產物,已經逐步拋棄,有些網站為了向下兼容還保留了這兩個字段。如果一個報文中同時出現Pragma和Cache-Control時,以Pragma為准。同時出現Cache-Control和Expires時,以Cache-Control為准。即優先級從高到低是 Pragma -> Cache-Control -> Expires

Cache-Control
在介紹之前,先啰嗦兩個容易忽視的地方:

符合緩存策略時,服務器不會發送新的資源,但不是說客戶端和服務器就沒有會話了,客戶端還是會發請求到服務器的。
Cache-Control除了在響應中使用,在請求中也可以使用。我們用開發者工具來模擬下請求時帶上Cache-Control:勾選Disable cache,刷新頁面,可以看到Request Headers中有個字段Cache-Control: no-cache。

同時在Response Headers中也能到Cache-Control字段,它的值是must-revalidate,這是服務端設置的。
Cache-Control字段
在請求中使用Cache-Control 時,它可選的值有:

在響應中使用Cache-Control 時,它可選的值有:

no-store優先級最高
在Cache-Control 中,這些值可以自由組合,多個值如果沖突時,也是有優先級的,而no-store優先級最高。我們可以測試下:在nginx中做如下配置:

server {
listen 88;
root /opt/ms;
index index.php index.html index.htm index.nginx-debian.html;

location ~* ^.+\.(css|js|txt|xml|swf|wav)$ {
add_header Cache-Control no-store;
add_header Cache-Control max-age=3600;
add_header Cache-Control public;
add_header Cache-Control only-if-cached;
add_header Cache-Control no-cache;
add_header Cache-Control must-revalidate;
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
在/opt/ms下增加個文件type.css,內容如下:

a{
color: #000000;
}
a:focus,a:hover {
text-decoration: none;
color: #708090;
}
1
2
3
4
5
6
7
配置好之后,reload下nginx,在瀏覽器訪問地址http://127.0.0.1:88/type.css,可以看到響應頭部包含nginx配置中的字段:

重復刷新訪問,會發現每次的狀態碼都是200,原因是no-store的優先級最高,本地不保存,每次都需要服務器發送資源。

public和private的選擇
如果你用了CDN,你需要關注下這個值。CDN廠商一般會要求cache-control的值為public,提升緩存命中率。如果你的緩存命中率很低,而訪問量很大的話,可以看下是不是設置了private,no-cache這類的值。如果定義了max-age,可以不用再定義public,它們的意義是一樣的。

哪里設置Cache-Control
以LNMP的環境為例,一次響應經歷的過程是:php-cgi解析代碼並執行,將結果返回給nginx,如果nginx前面有反向代理,則會經過一次反向代理服務器,所以cache-control可能會在nginx,php-cgi,php代碼,反向代理服務器這些地方地方設置。在php.ini中,有個參數是session.cache_limiter,需要注意下。在nginx中有個很常見的配置:

location ~* ^.+\.(ico|gif|jpg|jpeg|png)$ {
expires 30d;
}
1
2
3
這個指令等同於cache-control: max-age=2592000,同時你會在響應頭部看到一個etag字段,這是由於nginx默認開啟,如果要關閉可以增加個配置etag off。這個etag就是我們接下要看的緩存校驗字段。

緩存校驗
在緩存中,我們需要一個機制來驗證緩存是否有效。比如服務器的資源更新了,客戶端需要及時刷新緩存;又或者客戶端的資源過了有效期,但服務器上的資源還是舊的,此時並不需要重新發送。緩存校驗就是用來解決這些問題的,在http 1.1 中,我們主要關注下Last-Modified 和 etag 這兩個字段。

Last-Modified
服務端在返回資源時,會將該資源的最后更改時間通過Last-Modified字段返回給客戶端。客戶端下次請求時通過If-Modified-Since或者If-Unmodified-Since帶上Last-Modified,服務端檢查該時間是否與服務器的最后修改時間一致:如果一致,則返回304狀態碼,不返回資源;如果不一致則返回200和修改后的資源,並帶上新的時間。

If-Modified-Since和If-Unmodified-Since的區別是:
If-Modified-Since:告訴服務器如果時間一致,返回狀態碼304
If-Unmodified-Since:告訴服務器如果時間不一致,返回狀態碼412

etag
單純的以修改時間來判斷還是有缺陷,比如文件的最后修改時間變了,但內容沒變。對於這樣的情況,我們可以使用etag來處理。
etag的方式是這樣:服務器通過某個算法對資源進行計算,取得一串值(類似於文件的md5值),之后將該值通過etag返回給客戶端,客戶端下次請求時通過If-None-Match或If-Match帶上該值,服務器對該值進行對比校驗:如果一致則不要返回資源。
If-None-Match和If-Match的區別是:
If-None-Match:告訴服務器如果一致,返回狀態碼304,不一致則返回資源
If-Match:告訴服務器如果不一致,返回狀態碼412

總結
緩存開關是: pragma, cache-control。
緩存校驗有:Expires,Last-Modified,etag。
從狀態碼的角度來看,它們的關系如下圖:

cache-control的各個值關系如下圖

————————————————
版權聲明:本文為CSDN博主「小卡車7號」的原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/u012375924/java/article/details/82806617


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM