HTTP請求頭Header及其作用詳解
下面是訪問的一個URL,http://www.hzau.edu.cn的一個header,根據實例分析各部分的功能和作用。
1、Accept,瀏覽器端能夠處理的內容類型。
例如: Accept: text/html 代表瀏覽器可以接受服務器回發的類型為 text/html 也就是我們常說的html文檔。如果服務器無法返回text/html類型的數據,服務器應該返回一個406錯誤(non acceptable)。通配符 * 代表任意類型,例如 Accept: */* 代表瀏覽器可以處理所有類型,(一般瀏覽器發給服務器都是發這個)。
2、Accept-Encoding, 瀏覽器能夠處理的的壓縮編碼。通常指定壓縮方法,是否支持壓縮,支持什么壓縮方法(gzip,deflate),(注意:這不是指字符編碼)。
例如: Accept-Encoding: zh-CN,zh;q=0.8
3、Accept-Language, 瀏覽器當前設置的語言。
語言跟字符集的區別:中文是語言,中文有多種字符集,比如big5,gb2312,gbk等等;例如: Accept-Language: en-us
4、Accept_Charset::瀏覽器能夠顯示的字符集
5、Connection:瀏覽器與服務器的連接類型
例如:Connection: keep-alive 當一個網頁打開完成后,客戶端和服務器之間用於傳輸HTTP數據的TCP連接不會關閉,如果客戶端再次訪問這個服務器上的網頁,會繼續使用這一條已經建立的連接。
例如: Connection: close 代表一個Request完成后,客戶端和服務器之間用於傳輸HTTP數據的TCP連接會關閉。
當客戶端再次發送Request,需要重新建立TCP連接。
6、Host,發送請求的頁面的域名。(發送請求時,該報頭域是必需的),請求報頭域主要用於指定被請求資源的Internet主機和端口號,它通常從HTTP URL中提取出來的。
例如: 我們在瀏覽器中輸入:http://www.hzau.edu.cn,瀏覽器發送的請求消息中,就會包含Host請求報頭域,如下:
Host:www.hzau.edu.cn,此處使用缺省端口號80,若指定了端口號,則變成:Host:指定端口號。
7、Referer,發送請求的頁面的URI。當瀏覽器向web服務器發送請求的時候,一般會帶上Referer,告訴服務器我是從哪個頁面鏈接過來的,服務器借此可以獲得一些信息用於處理。
比如從我主頁上鏈接到一個朋友那里,他的服務器就能夠從HTTP Referer中統計出每天有多少用戶點擊我主頁上的鏈接訪問他的網站。
8、User-Agent,瀏覽器的用戶代理字符串。告訴HTTP服務器, 客戶端使用的操作系統和瀏覽器的名稱和版本。
我們上網登陸論壇的時候,往往會看到一些歡迎信息,其中列出了你的操作系統的名稱和版本,你所使用的瀏覽器的名稱和版本,這往往讓很多人感到很神奇,實際上,服務器應用程序就是從User-Agent這個請求報頭域中獲取到這些信息User-Agent請求報頭域允許客戶端將它的操作系統、瀏覽器和其它屬性告訴服務器。
例如: User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA;
.NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)
9、Cookie,用來存儲一些用戶信息以便讓服務器辨別用戶身份的(大多數需要登錄的網站上面會比較常見)。
比如cookie會存儲一些用戶的用戶名和密碼,當用戶登錄后就會在客戶端產生一個cookie來存儲相關信息,這樣瀏覽器通過讀取cookie的信息去服務器上驗證並通過后會判定你是合法用戶,從而允許查看相應網頁。當然cookie里面的數據不僅僅是上述范圍,還有很多信息可以存儲是cookie里面,比如sessionid等。
8、Cache-Control,指明當前資源的有效期,控制瀏覽器是否直接從瀏覽器緩存取數據,還是重新發請求到服務器獲取數據。
我們網頁的緩存控制是由HTTP頭中的“Cache-control”來實現的,常見值有private、no-cache、max-age、must-revalidate等,默認為private。這幾種值的作用是根據重新查看某一頁面時不同的方式來區分的:
(1)、打開新窗口
值為private、no-cache、must-revalidate,那么打開新窗口訪問時都會重新訪問服務器。而如果指定了max-age值(單位為秒),那么在此值內的時間里就不會重新訪問服務器,例如:
Cache-control: max-age=5(表示當訪問此網頁后的5秒內再次訪問不會去服務器)
(2)、在地址欄回車
值為private或must-revalidate則只有第一次訪問時會訪問服務器,以后就不再訪問。
值為no-cache,那么每次都會訪問。
值為max-age,則在過期之前不會重復訪問。
(3)、按后退按扭
值為private、must-revalidate、max-age,則不會重訪問,
值為no-cache,則每次都重復訪問
(4)、按刷新按扭
無論為何值,都會重復訪問
10、If-Modified-Since, 把瀏覽器端緩存頁面的最后修改時間發送到服務器去,服務器會把這個時間與服務器上實際文件的最后修改時間進行對比。
如果時間一致,那么返回304,客戶端就直接使用本地緩存文件。如果時間不一致,就會返回200和新的文件內容。客戶端接到之后,會丟棄舊文件,把新文件緩存起來,並顯示在瀏覽器中。
例如:Mon, 17 Aug 2015 12:03:33 GMT
11、If-None-Match, If-None-Match和ETag一起工作,工作原理是在HTTP Response中添加ETag信息。 當用戶再次請求該資源時,將在HTTP Request 中加入If-None-Match信息(ETag的值)。如果服務器驗證資源的ETag沒有改變(該資源沒有更新),將返回一個304狀態告訴客戶端使用本地緩存文件。否則將返回200狀態和新的資源和Etag. 使用這樣的機制將提高網站的性能。