HTTP協議詳細總結


HTTP超文本傳輸協議,是WWW上應用的最多的協議。了解和掌握HTTP協議是對程序人員的基本要求。

轉載請注明出處 http://www.cnblogs.com/zrtqsk/p/3746891.html ,謝謝

一、HTTP介紹

  HTTP是一個基於請求/響應模式的、無狀態的協議。即,瀏覽器與服務端連接之后,瀏覽器向服務器發送一個請求,服務器返回響應信息之后,雙方的鏈接就被關閉。我們要知道,應用層的HTTP要使用傳輸層的TCP協議來完成。而TCP協議是通過“3次握手”建立連接,是面向連接的協議。默認情況下,瀏覽器與Web服務器上80端口監聽的服務器程序建立TCP連接。

  HTTP1.0是典型的請求/響應模式。為了減少服務器的開銷,HTTP1.1默認有“持續連接”的機制。通過這種機制,客戶端發送請求得到響應后,連接不會馬上關閉,可以繼續發送請求,還可以流水線發送多個請求、而不用等待每一個響應的到來。

 

二、URI和URL

  URI(統一資源標識符)純粹是一種符號結構,用於指定構成Web資源的字符串的各個不同部分。而URL(統一資源定位符)是一種特殊的URI,包含了用於查找某個資源的足夠信息。

  URI是一種語義上的抽象概念,可以是絕對的,也可以是相對的,而URL則必須提供足夠的信息來定位,所以,是絕對的,而通常說的relative URL,則是針對另一個absolute URL,本質上還是絕對的。

 

三、HTTP請求

格式如圖:CRLF表示回車符+換行符,不同顏色之間用空格隔開

第一行叫做請求行。所以我們可以說HTTP請求由請求行、消息報頭、請求正文組成。

 

1、請求行

如上,請求行以一個方法符號開頭,空格之后,一個請求URI,再空格,然后一個HTTP版本,最后一個回車換行。

其中請求方法有如下幾種:

我們在瀏覽器地址欄直接輸入地址的時候,采用的就是GET方法。

HEAD方法一般用於測試超鏈接的有效性,因為它只是請求響應消息的報頭。消息報頭后面會講。

(HTTP協議中,請求方法必須全部大寫)

 

2、請求正文

類似name=XXX&pwd=XXXX的內容

 

四、HTTP響應

格式與HTTP請求類似,如圖:

第一行叫做狀態行。所以我們可以說HTTP響應由狀態行、消息報頭、響應正文組成。

1、狀態行

如上,狀態行由一個HTTP版本,空格后,一個狀態碼,再空格,一個狀態碼的文本描述,最后一個回車換行構成。

狀態代碼有3位數字組成,狀態描述給出了狀態代碼簡短的描述。狀態碼第一個數字定義了響應的類別,有五種可能取值:
  1xx  :  指示信息--表示請求已接收,繼續處理
  2xx  :  成功--表示請求已被成功接收、理解、接受
  3xx  :  重定向--要完成請求必須進行更進一步的操作
  4xx  :  客戶端錯誤--請求有語法錯誤或請求無法實現
  5xx  :  服務器端錯誤--服務器未能實現合法的請求

全部取值如下:

  100——客戶必須繼續發出請求
  101——客戶要求服務器根據請求轉換HTTP協議版本

  200——交易成功
  201——提示知道新文件的URL
  202——接受和處理、但處理未完成
  203——返回信息不確定或不完整
  204——請求收到,但返回信息為空
  205——服務器完成了請求,用戶代理必須復位當前已經瀏覽過的文件
  206——服務器已經完成了部分用戶的GET請求

  300——請求的資源可在多處得到
  301——刪除請求數據
  302——在其他地址發現了請求數據
  303——建議客戶訪問其他URL或訪問方式
  304——客戶端已經執行了GET,但文件未變化
  305——請求的資源必須從服務器指定的地址得到
  306——前一版本HTTP中使用的代碼,現行版本中不再使用
  307——申明請求的資源臨時性刪除

  400——錯誤請求,如語法錯誤
  401——請求授權失敗
  402——保留有效ChargeTo頭響應
  403——請求不允許
  404——沒有發現文件、查詢或URl
  405——用戶在Request-Line字段定義的方法不允許
  406——根據用戶發送的Accept拖,請求資源不可訪問
  407——類似401,用戶必須首先在代理服務器上得到授權
  408——客戶端沒有在用戶指定的餓時間內完成請求
  409——對當前資源狀態,請求不能完成
  410——服務器上不再有此資源且無進一步的參考地址
  411——服務器拒絕用戶定義的Content-Length屬性請求
  412——一個或多個請求頭字段在當前請求中錯誤
  413——請求的資源大於服務器允許的大小
  414——請求的資源URL長於服務器允許的長度
  415——請求資源不支持請求項目格式
  416——請求中包含Range請求頭字段,在當前請求資源范圍內沒有range指示值,請求也不包含If-Range請求頭字段
  417——服務器不滿足請求Expect頭字段指定的期望值,如果是代理服務器,可能是下一級服務器不能滿足請求

  500——服務器產生內部錯誤
  501——服務器不支持請求的函數
  502——服務器暫時不可用,有時是為了防止發生系統過載
  503——服務器過載或暫停維修
  504——關口過載,服務器使用另一個關口或服務來響應用戶,等待時間設定值較長
  505——服務器不支持或拒絕支請求頭中指定的HTTP版本

消息報頭下面會講。

 

2、響應正文

  所謂響應正文,就是服務器返回的資源的內容。即整個HTML文件。

 

五、消息報頭

  HTTP請求和HTTP響應都有消息報頭。而消息報頭是由眾多報頭域組成。每一個報頭域都由名字+“:”+空格組成,消息報頭域的名字是大小寫無關的。

HTTP消息報頭包括普通報頭、請求報頭、響應報頭和實體報頭。

1、普通報頭:

在普通報頭中,有少數報頭域用於所有的請求和響應消息,但並不用於被傳輸的實體,只用於傳輸的消息。

普通報頭包括:

常見的普通報頭:

1)Cache-Control

Cache-Control用於指定緩存指令,緩存指令是單向的(響應中出現的緩存指令在請求中未必會出現),且是獨立的(一個消息的緩存指令不會影響另一個消息處理的緩存機制),HTTP1.0使用的類似的報頭域為Pragma。

請求時的緩存指令包括:no-cache(用於指示請求或響應消息不能緩存)、no-store、max-age、max-stale、min-fresh、only-if-cached;
響應時的緩存指令包括:public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age、s-maxage.

2)Date

Date普通報頭域表示消息產生的日期和時間

3)Connection

Connection普通報頭域允許發送指定連接的選項。例如指定連接是連續,或者指定“close”選項,通知服務器,在響應完成后,關閉連接

 

2、請求報頭

請求報頭允許客戶端向服務器端傳遞請求的附加信息以及客戶端自身的信息。

請求報頭包括:

常見的請求報頭:

1)Accept

Accept請求報頭域用於指定客戶端接受哪些類型的信息。

2)Accept-Charset

Accept-Charset請求報頭域用於指定客戶端接受的字符集。如果在請求消息中沒有設置這個域,缺省是任何字符集都可以接受。

3)Accept-Encoding

Accept-Encoding請求報頭域類似於Accept,但是它是用於指定可接受的內容編碼。如果請求消息中沒有設置這個域服務器假定客戶端對各種內容編碼都可以接受。

4)Accept-Language

Accept-Language請求報頭域類似於Accept,但是它是用於指定一種自然語言如果請求消息中沒有設置這個報頭域,服務器假定客戶端對各種語言都可以接受。

5)Authorization

Authorization請求報頭域主要用於證明客戶端有權查看某個資源。當瀏覽器訪問一個頁面時,如果收到服務器的響應代碼為401(未授權),可以發送一個包含Authorization請求報頭域的請求,要求服務器對其進行驗證。

6)Host

發送請求時,該報頭域是必需的。Host請求報頭域主要用於指定被請求資源的Internet主機和端口號,它通常從HTTP URL中提取出來的。

7)User-Agent
User-Agent請求報頭域允許客戶端將它的操作系統、瀏覽器和其它屬性告訴服務器。不過,這個報頭域不是必需的,如果我們自己編寫一個瀏覽器,不使用User-Agent請求報頭域,那么服務器端就
無法得知我們的信息了。

 

3、響應報頭

響應報頭允許服務器傳遞不能放在狀態行中的附加響應信息,以及關於服務器的信息和對Request-URI所標識的資源進行下一步訪問的信息。

響應報頭包括:

常見的實體報頭:

1)Location

Location響應報頭域用於重定向接受者到一個新的位置。Location響應報頭域常用在更換域名的時候。

2)Server

Server響應報頭域包含了服務器用來處理請求的軟件信息。與User-Agent請求報頭域是相對應的。

3)WWW-Authenticate

WWW-Authenticate響應報頭域必須被包含在401(未授權的)響應消息中,客戶端收到401響應消息時候,並發送Authorization報頭域請求服務器對其進行驗證時,服務端響應報頭就包含該報頭域。

 

4、實體報頭

請求和響應消息都可以傳送一個實體。一個實體由實體報頭域和實體正文組成,但並不是說實體報頭域和實體正文要在一起發送,可以只發送實體報頭域。實體報頭定義了關於實體正文(eg:有無實體正文)和請求所標識的資源的元信息。

實體報頭包括:

常見的實體報頭:

1)Content-Encoding

Content-Encoding實體報頭域被用作媒體類型的修飾符,它的值指示了已經被應用到實體正文的附加內容的編碼,因而要獲得Content-Type報頭域中所引用的媒體類型,必須采用相應的解碼機制。Content-Encoding主要用於記錄文檔的壓縮方法。

2)Content-Language

Content-Language實體報頭域描述了資源所用的自然語言。沒有設置該域則認為實體內容將提供給所有的語言
閱讀者。

3)Content-Length

Content-Length實體報頭域用於指明實體正文的長度,以字節方式存儲的十進制數字來表示。即一個數字字符占一個字節,用其對應的ASCII碼來存儲傳輸。

4)Content-Type

Content-Type實體報頭域用語指明發送給接收者的實體正文的媒體類型。

5)Expires

Expires實體報頭域給出響應過期的日期和時間。為了讓代理服務器或瀏覽器在一段時間以后更新緩存中(再次訪問曾訪問過的頁面時,直接從緩存中加載,縮短響應時間和降低服務器負載)的頁面,我們可以使用Expires實體報頭域指定頁面過期的時間。

6)Last-Modified

Last-Modified實體報頭域用於指示資源的最后修改日期和時間。

 

六、長度限制

1、URL長度限制

1)HTTP協議中沒有對URL的長度進行限制,但是Web服務器和瀏覽器對URI都有自己的長度限制。服務器一般是通過控制http請求頭的長度來進行限制的。tomcat的請求配置參數為maxHttpHeaderSize。

2)瀏覽器的限制

每種瀏覽器也會對url的長度有所限制,下面是幾種常見瀏覽器的url長度限制:(單位:字符)
  IE  :  2803ASCII字符
  Firefox  :  65536ASCII字符 
  Chrome  :  8182ASCII字符
  Safari  :  80000ASCII字符
  Opera  :  190000ASCII字符
對於get請求,在url的長度限制范圍之內,請求的參數個數沒有限制。
 

2. Post數據的長度限制

Post數據的長度限制與url長度限制類似,也是在Http協議中沒有規定長度限制,長度限制可以在服務器端配置最大http請求頭長度的方式來實現。
 

3、Cookie的長度限制

1)瀏覽器所允許的每個域下的最大cookie數目

IE :原先為20個,后來升級為50個

Firefox: 50個

Opera:30個

Chrome:180個

Safari:無限制

當Cookie數超過限制數時瀏覽器的行為:IE和Opera會采用LRU算法將老的不常使用的Cookie清除掉,Firefox的行為是隨機踢出某些Cookie的值。當然無論怎樣的策略,還是盡量不要讓Cookie數目超過瀏覽器所允許的范圍。

 

2) 瀏覽器所允許的每個Cookie的最大長度

Firefox和Safari  :  4079字節

Opera  :  4096字節

IE  :  4095字節

 

(3) 服務器中Http請求頭長度的限制。

Cookie會被附在每次http請求頭中傳遞給服務器,因此還會受到服務器請求頭長度的影響。

 

4. Html5 LocalStorage的長度限制

Html5提供了本地存儲機制來供Web應用在客戶端存儲數據,盡管這個並不屬於Http協議的一部分,但是隨着Html5的流行,我們可能需要越來越多使用LocalStorage,甚至當它普及的時候跟它打交道就會同今天我們跟Cookie打交道一樣多。

對於LocalStorage的長度限制,同Cookie的限制類似,也是瀏覽器針對域來限制,只不過cookie限制的是個數,LocalStorage限制的是長度:

Firefox\Chrome\Opera  :  5MB

IE  :  10MB

 

 

 

參考引用:http://blog.sina.com.cn/s/blog_5f5716580100lq5x.html

     http://www.php100.com/html/itnews/it/2012/1216/11778.html

     《Java Web開發詳解》-孫鑫


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM