HTTP 傳輸內容的壓縮


一、HTTP壓縮和內容編碼的區別

HTTP壓縮,在HTTP協議中,其實是內容編碼的一種。

在http協議中,可以對內容(也就是body部分)進行編碼, 可以采用gzip這樣的編碼。 從而達到壓縮的目的。 也可以使用其他的編碼把內容攪亂或加密,以此來防止未授權的第三方看到文檔的內容。

所以我們說HTTP壓縮,其實就是HTTP內容編碼的一種。 所以大家不要把HTTP壓縮和HTTP內容編碼兩個概念混淆了。

 

二、HTTP壓縮

HTTP壓縮是指: Web服務器和瀏覽器之間壓縮傳輸的”文本內容“的方法。 HTTP采用通用的壓縮算法,比如gzip來壓縮html,javascript, CSS文件。 能大大減少網絡傳輸的數據量,提高了用戶顯示網頁的速度。當然,同時會增加一點點服務器的開銷。 本文從HTTP協議的角度,來理解HTTP壓縮這個概念。

首先,瀏覽器發送一個請求(request)給web服務器,支持一個壓縮格式如(gzip),服務端會將原來的源碼壓縮之后,通過http響應(response)信息返回給web瀏覽器,瀏覽器接收之后,顯示出來。

 

三、HTTP壓縮的過程

1. 瀏覽器發送Http request 給Web服務器,  request 中有Accept-Encoding: gzip, deflate。 (告訴服務器, 瀏覽器支持gzip壓縮)

2. Web服務器接到request后, 生成原始的Response, 其中有原始的Content-Type和Content-Length。

3. Web服務器通過Gzip,來對Response進行編碼, 編碼后header中有Content-Type和Content-Length(壓縮后的大小), 並且增加了Content-Encoding:gzip.  然后把Response發送給瀏覽器。

4. 瀏覽器接到Response后,根據Content-Encoding:gzip來對Response 進行解碼。 獲取到原始response后, 然后顯示出網頁。
如下圖:

四、內容編碼類型

HTTP定義了一些標准的內容編碼類型,並允許用擴展的形式添加更多的編碼。

Content-Encoding header 就用這些標准化的代號來說明編碼時使用的算法

Content-Encoding值

  • gzip  表明實體采用GNU zip編碼
  • compress 表明實體采用Unix的文件壓縮程序
  • deflate  表明實體是用zlib的格式壓縮的
  • identity  表明沒有對實體進行編碼。當沒有Content-Encoding header時, 就默認為這種情況

gzip, compress, 以及deflate編碼都是無損壓縮算法,用於減少傳輸報文的大小,不會導致信息損失。 其中gzip通常效率最高, 使用最為廣泛。

壓縮的好處

http壓縮對純文本可以壓縮至原內容的40%, 從而節省了60%的數據傳輸。

Gzip的缺點

JPEG這類文件用gzip壓縮的不夠好。

Gzip是如何壓縮的

簡單來說, Gzip壓縮是在一個文本文件中找出類似的字符串, 並臨時替換他們,使整個文件變小。這種形式的壓縮對Web來說非常適合, 因為HTML和CSS文件通常包含大量的重復的字符串,例如空格,標簽。

HTTP Response能壓縮,HTTP Request也是可以壓縮的

瀏覽器是不會對Request壓縮的。 但是 一些HTTP程序在發送Request時,會對其進行編碼。

 

本文轉自:
http://www.cnblogs.com/z-sm/p/5478495.html
http://liuviphui.blog.163.com/blog/static/20227308420141843933379/


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM