HTTP超文本傳輸協議,是WWW上應用的最多的協議。了解和掌握HTTP協議是對程序人員的基本要求。
轉載請注明出處 http://www.cnblogs.com/zrtqsk/p/3746891.html ,謝謝
一、HTTP介紹
HTTP是一個基於請求/響應模式的、無狀態的協議。即,瀏覽器與服務端連接之后,瀏覽器向服務器發送一個請求,服務器返回響應信息之后,雙方的鏈接就被關閉。我們要知道,應用層的HTTP要使用傳輸層的TCP協議來完成。而TCP協議是通過“3次握手”建立連接,是面向連接的協議。默認情況下,瀏覽器與Web服務器上80端口監聽的服務器程序建立TCP連接。
HTTP1.0是典型的請求/響應模式。為了減少服務器的開銷,HTTP1.1默認有“持續連接”的機制。通過這種機制,客戶端發送請求得到響應后,連接不會馬上關閉,可以繼續發送請求,還可以流水線發送多個請求、而不用等待每一個響應的到來。
二、URI和URL
URI(統一資源標識符)純粹是一種符號結構,用於指定構成Web資源的字符串的各個不同部分。而URL(統一資源定位符)是一種特殊的URI,包含了用於查找某個資源的足夠信息。
URI是一種語義上的抽象概念,可以是絕對的,也可以是相對的,而URL則必須提供足夠的信息來定位,所以,是絕對的,而通常說的relative URL,則是針對另一個absolute URL,本質上還是絕對的。
三、HTTP請求
格式如圖:(CRLF表示回車符+換行符,不同顏色之間用空格隔開)
第一行叫做請求行。所以我們可以說HTTP請求由請求行、消息報頭、請求正文組成。
1、請求行
如上,請求行以一個方法符號開頭,空格之后,一個請求URI,再空格,然后一個HTTP版本,最后一個回車換行。
其中請求方法有如下幾種:
我們在瀏覽器地址欄直接輸入地址的時候,采用的就是GET方法。
HEAD方法一般用於測試超鏈接的有效性,因為它只是請求響應消息的報頭。消息報頭后面會講。
(HTTP協議中,請求方法必須全部大寫)
2、請求正文
類似name=XXX&pwd=XXXX的內容
四、HTTP響應
格式與HTTP請求類似,如圖:
第一行叫做狀態行。所以我們可以說HTTP響應由狀態行、消息報頭、響應正文組成。
1、狀態行
如上,狀態行由一個HTTP版本,空格后,一個狀態碼,再空格,一個狀態碼的文本描述,最后一個回車換行構成。
狀態代碼有3位數字組成,狀態描述給出了狀態代碼簡短的描述。狀態碼第一個數字定義了響應的類別,有五種可能取值:
1xx : 指示信息--表示請求已接收,繼續處理
2xx : 成功--表示請求已被成功接收、理解、接受
3xx : 重定向--要完成請求必須進行更進一步的操作
4xx : 客戶端錯誤--請求有語法錯誤或請求無法實現
5xx : 服務器端錯誤--服務器未能實現合法的請求
全部取值如下:
100——客戶必須繼續發出請求
101——客戶要求服務器根據請求轉換HTTP協議版本
200——交易成功
201——提示知道新文件的URL
202——接受和處理、但處理未完成
203——返回信息不確定或不完整
204——請求收到,但返回信息為空
205——服務器完成了請求,用戶代理必須復位當前已經瀏覽過的文件
206——服務器已經完成了部分用戶的GET請求
300——請求的資源可在多處得到
301——刪除請求數據
302——在其他地址發現了請求數據
303——建議客戶訪問其他URL或訪問方式
304——客戶端已經執行了GET,但文件未變化
305——請求的資源必須從服務器指定的地址得到
306——前一版本HTTP中使用的代碼,現行版本中不再使用
307——申明請求的資源臨時性刪除
400——錯誤請求,如語法錯誤
401——請求授權失敗
402——保留有效ChargeTo頭響應
403——請求不允許
404——沒有發現文件、查詢或URl
405——用戶在Request-Line字段定義的方法不允許
406——根據用戶發送的Accept拖,請求資源不可訪問
407——類似401,用戶必須首先在代理服務器上得到授權
408——客戶端沒有在用戶指定的餓時間內完成請求
409——對當前資源狀態,請求不能完成
410——服務器上不再有此資源且無進一步的參考地址
411——服務器拒絕用戶定義的Content-Length屬性請求
412——一個或多個請求頭字段在當前請求中錯誤
413——請求的資源大於服務器允許的大小
414——請求的資源URL長於服務器允許的長度
415——請求資源不支持請求項目格式
416——請求中包含Range請求頭字段,在當前請求資源范圍內沒有range指示值,請求也不包含If-Range請求頭字段
417——服務器不滿足請求Expect頭字段指定的期望值,如果是代理服務器,可能是下一級服務器不能滿足請求
500——服務器產生內部錯誤
501——服務器不支持請求的函數
502——服務器暫時不可用,有時是為了防止發生系統過載
503——服務器過載或暫停維修
504——關口過載,服務器使用另一個關口或服務來響應用戶,等待時間設定值較長
505——服務器不支持或拒絕支請求頭中指定的HTTP版本
消息報頭下面會講。
2、響應正文
所謂響應正文,就是服務器返回的資源的內容。即整個HTML文件。
五、消息報頭
HTTP請求和HTTP響應都有消息報頭。而消息報頭是由眾多報頭域組成。每一個報頭域都由名字+“:”+空格組成,消息報頭域的名字是大小寫無關的。
HTTP消息報頭包括普通報頭、請求報頭、響應報頭和實體報頭。
1、普通報頭:
在普通報頭中,有少數報頭域用於所有的請求和響應消息,但並不用於被傳輸的實體,只用於傳輸的消息。
普通報頭包括:
常見的普通報頭:
1)Cache-Control
Cache-Control用於指定緩存指令,緩存指令是單向的(響應中出現的緩存指令在請求中未必會出現),且是獨立的(一個消息的緩存指令不會影響另一個消息處理的緩存機制),HTTP1.0使用的類似的報頭域為Pragma。
請求時的緩存指令包括:no-cache(用於指示請求或響應消息不能緩存)、no-store、max-age、max-stale、min-fresh、only-if-cached;
響應時的緩存指令包括:public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age、s-maxage.
2)Date
Date普通報頭域表示消息產生的日期和時間
3)Connection
Connection普通報頭域允許發送指定連接的選項。例如指定連接是連續,或者指定“close”選項,通知服務器,在響應完成后,關閉連接
2、請求報頭
請求報頭允許客戶端向服務器端傳遞請求的附加信息以及客戶端自身的信息。
請求報頭包括:
常見的請求報頭:
1)Accept
Accept請求報頭域用於指定客戶端接受哪些類型的信息。
2)Accept-Charset
Accept-Charset請求報頭域用於指定客戶端接受的字符集。如果在請求消息中沒有設置這個域,缺省是任何字符集都可以接受。
3)Accept-Encoding
Accept-Encoding請求報頭域類似於Accept,但是它是用於指定可接受的內容編碼。如果請求消息中沒有設置這個域服務器假定客戶端對各種內容編碼都可以接受。
4)Accept-Language
Accept-Language請求報頭域類似於Accept,但是它是用於指定一種自然語言如果請求消息中沒有設置這個報頭域,服務器假定客戶端對各種語言都可以接受。
5)Authorization
Authorization請求報頭域主要用於證明客戶端有權查看某個資源。當瀏覽器訪問一個頁面時,如果收到服務器的響應代碼為401(未授權),可以發送一個包含Authorization請求報頭域的請求,要求服務器對其進行驗證。
6)Host
發送請求時,該報頭域是必需的。Host請求報頭域主要用於指定被請求資源的Internet主機和端口號,它通常從HTTP URL中提取出來的。
7)User-Agent
User-Agent請求報頭域允許客戶端將它的操作系統、瀏覽器和其它屬性告訴服務器。不過,這個報頭域不是必需的,如果我們自己編寫一個瀏覽器,不使用User-Agent請求報頭域,那么服務器端就
無法得知我們的信息了。
3、響應報頭
響應報頭允許服務器傳遞不能放在狀態行中的附加響應信息,以及關於服務器的信息和對Request-URI所標識的資源進行下一步訪問的信息。
響應報頭包括:
常見的實體報頭:
1)Location
Location響應報頭域用於重定向接受者到一個新的位置。Location響應報頭域常用在更換域名的時候。
2)Server
Server響應報頭域包含了服務器用來處理請求的軟件信息。與User-Agent請求報頭域是相對應的。
3)WWW-Authenticate
WWW-Authenticate響應報頭域必須被包含在401(未授權的)響應消息中,客戶端收到401響應消息時候,並發送Authorization報頭域請求服務器對其進行驗證時,服務端響應報頭就包含該報頭域。
4、實體報頭
請求和響應消息都可以傳送一個實體。一個實體由實體報頭域和實體正文組成,但並不是說實體報頭域和實體正文要在一起發送,可以只發送實體報頭域。實體報頭定義了關於實體正文(eg:有無實體正文)和請求所標識的資源的元信息。
實體報頭包括:
常見的實體報頭:
1)Content-Encoding
Content-Encoding實體報頭域被用作媒體類型的修飾符,它的值指示了已經被應用到實體正文的附加內容的編碼,因而要獲得Content-Type報頭域中所引用的媒體類型,必須采用相應的解碼機制。Content-Encoding主要用於記錄文檔的壓縮方法。
2)Content-Language
Content-Language實體報頭域描述了資源所用的自然語言。沒有設置該域則認為實體內容將提供給所有的語言
閱讀者。
3)Content-Length
Content-Length實體報頭域用於指明實體正文的長度,以字節方式存儲的十進制數字來表示。即一個數字字符占一個字節,用其對應的ASCII碼來存儲傳輸。
4)Content-Type
Content-Type實體報頭域用語指明發送給接收者的實體正文的媒體類型。
5)Expires
Expires實體報頭域給出響應過期的日期和時間。為了讓代理服務器或瀏覽器在一段時間以后更新緩存中(再次訪問曾訪問過的頁面時,直接從緩存中加載,縮短響應時間和降低服務器負載)的頁面,我們可以使用Expires實體報頭域指定頁面過期的時間。
6)Last-Modified
Last-Modified實體報頭域用於指示資源的最后修改日期和時間。
六、長度限制
1、URL長度限制
1)HTTP協議中沒有對URL的長度進行限制,但是Web服務器和瀏覽器對URI都有自己的長度限制。服務器一般是通過控制http請求頭的長度來進行限制的。tomcat的請求配置參數為maxHttpHeaderSize。
2)瀏覽器的限制
2. Post數據的長度限制
3、Cookie的長度限制
1)瀏覽器所允許的每個域下的最大cookie數目
IE :原先為20個,后來升級為50個
Firefox: 50個
Opera:30個
Chrome:180個
Safari:無限制
當Cookie數超過限制數時瀏覽器的行為:IE和Opera會采用LRU算法將老的不常使用的Cookie清除掉,Firefox的行為是隨機踢出某些Cookie的值。當然無論怎樣的策略,還是盡量不要讓Cookie數目超過瀏覽器所允許的范圍。
2) 瀏覽器所允許的每個Cookie的最大長度
Firefox和Safari : 4079字節
Opera : 4096字節
IE : 4095字節
(3) 服務器中Http請求頭長度的限制。
Cookie會被附在每次http請求頭中傳遞給服務器,因此還會受到服務器請求頭長度的影響。
4. Html5 LocalStorage的長度限制
Html5提供了本地存儲機制來供Web應用在客戶端存儲數據,盡管這個並不屬於Http協議的一部分,但是隨着Html5的流行,我們可能需要越來越多使用LocalStorage,甚至當它普及的時候跟它打交道就會同今天我們跟Cookie打交道一樣多。
對於LocalStorage的長度限制,同Cookie的限制類似,也是瀏覽器針對域來限制,只不過cookie限制的是個數,LocalStorage限制的是長度:
Firefox\Chrome\Opera : 5MB
IE : 10MB
參考引用:http://blog.sina.com.cn/s/blog_5f5716580100lq5x.html
http://www.php100.com/html/itnews/it/2012/1216/11778.html
《Java Web開發詳解》-孫鑫