HTTP協議Etag詳解

本文轉載自查看原文 2012-08-17 17:32 5936 日常

HTTP協議規格說明定義ETag為“被請求變量的實體值”。

另一種說法是，ETag是一個可以與Web資源關聯的記號（token）。典型的Web資源可以一個Web頁，但也可能是JSON或XML文檔。服務器單獨負責判斷記號是什么及其含義，並在HTTP響應頭中將其傳送到客戶端，以下是服務器端返回的格式：

ETag:"50b1c1d4f775c61:df3"

客戶端的查詢更新格式是這樣的：

If-None-Match : W / "50b1c1d4f775c61:df3"

如果ETag沒改變，則返回狀態304然后不返回，這也和Last-Modified一樣。

測試Etag主要在斷點下載時比較有用。

Etag - Last-Modified和Etags如何幫助提高性能?

聰明的開發者會把Last-Modified和ETags請求的http報頭一起使用，這樣可利用客戶端（例如瀏覽器）的緩存。因為服務器首先產生Last-Modified/Etag標記，服務器可在稍后使用它來判斷頁面是否已經被修改。本質上，客戶端通過將該記號傳回服務器要求服務器驗證其（客戶端）緩存。
過程如下:
1.客戶端請求一個頁面（A）。
2.服務器返回頁面A，並在給A加上一個Last-Modified/ETag。
3.客戶端展現該頁面，並將頁面連同Last-Modified/ETag一起緩存。
4.客戶再次請求頁面A，並將上次請求時服務器返回的Last-Modified/ETag一起傳遞給服務器。
5.服務器檢查該Last-Modified或ETag，並判斷出該頁面自上次客戶端請求之后還未被修改，直接返回響應304和一個空的響應體。

Etag - 作用

Etag 主要為了解決 Last-Modified 無法解決的一些問題。

1、一些文件也許會周期性的更改，但是他的內容並不改變(僅僅改變的修改時間)，這個時候我們並不希望客戶端認為這個文件被修改了，而重新GET;

2、某些文件修改非常頻繁，比如在秒以下的時間內進行修改，(比方說1s內修改了N次)，If-Modified-Since能檢查到的粒度是s級的，這種修改無法判斷(或者說UNIX記錄MTIME只能精確到秒)

3、某些服務器不能精確的得到文件的最后修改時間；

為此，HTTP/1.1 引入了 Etag(Entity Tags).Etag僅僅是一個和文件相關的標記，可以是一個版本標記,比如說v1.0.0或者說"2e681a-6-5d044840"這么一串看起來很神秘的編碼。但是HTTP/1.1標准並沒有規定Etag的內容是什么或者說要怎么實現，唯一規定的是Etag需要放在""內。

Etag - 工作原理

Etag由服務器端生成，客戶端通過If-Match或者說If-None-Match這個條件判斷請求來驗證資源是否修改。常見的是使用If-None-Match.請求一個文件的流程可能如下：

====第一次請求===
1.客戶端發起 HTTP GET 請求一個文件；
2.服務器處理請求，返回文件內容和一堆Header，當然包括Etag(例如"2e681a-6-5d044840")(假設服務器支持Etag生成和已經開啟了Etag).狀態碼200

====第二次請求===
1.客戶端發起 HTTP GET 請求一個文件，注意這個時候客戶端同時發送一個If-None-Match頭，這個頭的內容就是第一次請求時服務器返回的Etag：2e681a-6-5d044840
2.服務器判斷發送過來的Etag和計算出來的Etag匹配，因此If-None-Match為False，不返回200，返回304，客戶端繼續使用本地緩存；

流程很簡單，問題是，如果服務器又設置了Cache-Control:max-age和Expires呢，怎么辦？
答案是同時使用，也就是說在完全匹配If-Modified-Since和If-None-Match即檢查完修改時間和Etag之后，服務器才能返回304.(不要陷入到底使用誰的問題怪圈)

Etag - Apache中Etag實現

1.Apache首先判斷是不是弱Etag，這個留在下面講。如果不是，進入第二種情況：

強Etag根據配置文件中的配置來設置Etag值，默認的Apache的FileEtag設置為：

FileEtag INode Mtime Size

也就是根據這三個屬性來生成Etag值，他們之間通過一些算法來實現，並輸出成hex的格式，相鄰屬性之間用-分隔，比如：

Etag"2e681a-6-5d044840"

這里面的三個段，分別代表了INode，MTime，Size根據算法算出的值的Hex格式，(如果在這里看到了非Hex里面的字符(也就是0-f)，那你可能看見神了:))

當然，可以改變Apache的FileEtag設置，比如設置成FileEtagSize,那么得到的Etag可能為：

Etag"6"

總之，設置了幾個段，Etag值就有幾個段。(不要誤以為Etag就是固定的3段式)

說明
這里說的都是Apache2.2里面的Etag實現，因為HTTP/1.1並沒有規定Etag必須是什么樣的實現或者格式，因此，也可以修改或者完全編寫自己的算法得到Etag，比如"2e681a65d044840"，客戶端會記住並緩存下這個Etag(Windows里面保存在哪里，下次訪問的時候直接拿這個值去和服務器生成的Etag對比。

注意
不管怎么樣的算法，在服務器端都要進行計算，計算就有開銷，會帶來性能損失。因此為了榨干這一點點性能，不少網站完全把Etag禁用了(比如Yahoo!)，這其實不符合HTTP/1.1的規定，因為HTTP/1.1總是鼓勵服務器盡可能的開啟Etag。

Etag - 弱校驗(弱Etag)

重新考慮前面提到的3個問題：

問題1、一些文件也許會周期性的更改，但是他的內容並不改變(僅僅改變的修改時間)，這個時候我們並不希望客戶端認為這個文件被修改了，而重新GET;

解決辦法：如果使用強Etag，每次得會要求重新GET頁面，如果使用Etag，比方說設置成 File Etag Size 等，就可以忽略 MTime 造成的 Last-Modified 時間修改從而影響了 If-Modified-Since(IMS) 這個校驗了。這點和弱Etag無關。

問題2、某些文件修改非常頻繁，比如在秒以下的時間內進行修改，(比方說1s內修改了N次)，If-Modified-Since能檢查到的粒度是s級的，這種修改無法判斷(或者說UNIX記錄MTIME只能精確到秒)

解決辦法：如果是這種情況，Apache會自動判斷請求時間和修改時間之間的差值，如果小於1s，Apache會認為這個文件在這1秒內可能會再次被修改，因此生成一個弱Etag(WeakEtag),這個Etag僅僅基於MTime來生成，因此MTime只能精確到s，所以1s內生成的Etag總是一樣，這樣就避免了使用強Etag造成的1s內頻繁的刷新Cache的情況。(貌似不用Etag，僅僅使用Last-Modified就可以解決，但是這針對的僅僅是修改超級頻繁的情況，很多文件可能同時也使用強Etag驗證)。弱Etag以W/開始，比如:W/"2e681a"

問題3、某些服務器不能精確的得到文件的最后修改時間；

解決辦法：生成Etag，因為Etag可以綜合Inode，MTime和Size，可以避免這個問題

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 HTTP協議緩存策略深入詳解之ETAG妙用你知道HTTP協議的ETag是干什么的嗎？ http強制緩存、協商緩存、指紋ETag詳解【HTTP協議】---HTTP協議詳解【HTTP協議】---HTTP協議詳解 HTTP協議（二）HTTP報文詳解 HTTP協議詳解（二）—— HTTP響應 http協議——cookie詳解 HTTP協議詳解 HTTP協議詳解