HTTP請求協議中請求報文(Request Headers)跟響應報文(Response Headers)的簡單理解


背景     

  今兒個一新來的應屆生問我,開發模式中所看到的web請求的請求頭里的屬性怎么理解,我便根據自己的經驗隨便拉開一個請求跟他聊了起來,順便自己記錄下文字版,以后再有交流直接發地址給他就好了,嘻嘻,機智!

 

題外話:

  一、構成HTTP請求的簡單流程圖(圖摘錄的),如下:

  

  Web Client可以是瀏覽器、搜索引擎、機器人等等一切基於HTTP協議發起http請求的工具。Web Server可以是任何的能解析HTTP請求,並返回給Web Client可識別的響應的服務,常見的有apache、nginx、IIS等等web服務器。

  二、客戶端跟服務的交互(這圖也是摘錄的,哈哈)

  

  要看圖還不明白中過程的話,那就更通俗的理解為:

  • 在瀏覽器中輸入URL,並按下回車鍵
  • 瀏覽器向DNS服務器請求解析該URL中的域名對應的IP地址(如果是IP請求,則不需要該步驟)
  • 解析出IP后,根據IP和端口號,和服務器建立TCP連接
  • 瀏覽器向服務器發送請求,該請求報文作為TCP三次握手的第三個報文發送給服務器
  • 服務器做出響應,把數據發送給瀏覽器
  • 通信完成,斷開TCP連接
  • 瀏覽器解析收到的數據並顯示  

  

從中就可以延伸出以下要說的內容了。也就是交互直接的報文,這里就簡單說說其中請求報文跟響應報文,主要也是方便新手簡單了解下,具體的底層還是得自己去查閱資料

 

內容

HTTP連接中報文分為請求(request)和響應(response)兩種。每種報文在HTTP首部都有不同的字段來標識不同的用途。

1. 請求報文:HTTP協議使用TCP協議進行傳輸,在應用層協議發起交互之前,首先是TCP的三次握手。完成了TCP三次握手后,客戶端會向服務器發出一個請求報文

  

 

  請求頭由key/value對組成,每行為一對,key和value之間通過冒號(:)分割。請求頭的作用主要用於通知服務端有關於客戶端的請求信息

HTTP最常見的請求頭如下:

       Accept:瀏覽器可接受的MIME類型;

       Accept-Charset:瀏覽器可接受的字符集;

       Accept-Encoding:瀏覽器能夠進行解碼的數據編碼方式,比如gzip。Servlet能夠向支持gzip的瀏覽器返回經gzip編碼的HTML頁面。許多情形下這可以減少5到10倍的下載時間;

      Accept-Language:瀏覽器所希望的語言種類,當服務器能夠提供一種以上的語言版本時要用到;

      Authorization:授權信息,通常出現在對服務器發送的WWW-Authenticate頭的應答中;

      Connection:表示是否需要持久連接。如果Servlet看到這里的值為“Keep-Alive”,或者看到請求使用的是HTTP 1.1(HTTP 1.1默認進行持久連接),它就可以利用持久連接的優點,當頁面包含多個元素時(例如Applet,圖片),顯著地減少下載所需要的時間。要實現這一點,Servlet需要在應答中發送一個Content-Length頭,最簡單的實現方法是:先把內容寫入ByteArrayOutputStream,然后在正式寫出內容之前計算它的大小;

      Content-Length:表示請求消息正文的長度;

      Cookie:這是最重要的請求頭信息之一;

      From:請求發送者的email地址,由一些特殊的Web客戶程序使用,瀏覽器不會用到它;

      Host:初始URL中的主機和端口;

      If-Modified-Since:只有當所請求的內容在指定的日期之后又經過修改才返回它,否則返回304“Not Modified”應答;

      Pragma:指定“no-cache”值表示服務器必須返回一個刷新后的文檔,即使它是代理服務器而且已經有了頁面的本地拷貝;

      Referer:包含一個URL,用戶從該URL代表的頁面出發訪問當前請求的頁面。

      User-Agent:瀏覽器類型,如果Servlet返回的內容與瀏覽器類型有關則該值非常有用;

     UA-Pixels,UA-Color,UA-OS,UA-CPU:由某些版本的IE瀏覽器所發送的非標准的請求頭,表示屏幕大小、顏色深度、操作系統和CPU類型。

2. 響應報文:當收到get或post等方法發來的請求后,服務器就要對報文進行響應。

 

常見的響應頭,如下:

        Allow:服務器支持哪些請求方法(如GET、POST等);

        Content-Encoding:文檔的編碼(Encode)方法。只有在解碼之后才可以得到Content-Type頭指定的內容類型。利用gzip壓縮文檔能夠顯著地減少HTML文檔的下載時間。Java的GZIPOutputStream可以很方便地進行gzip壓縮,但只有Unix上的Netscape和Windows上的IE 4、IE 5才支持它。因此,Servlet應該通過查看Accept-Encoding頭(即request.getHeader("Accept-Encoding"))檢查瀏覽器是否支持gzip,為支持gzip的瀏覽器返回經gzip壓縮的HTML頁面,為其他瀏覽器返回普通頁面;

        Content-Length:表示內容長度。只有當瀏覽器使用持久HTTP連接時才需要這個數據。如果你想要利用持久連接的優勢,可以把輸出文檔寫入ByteArrayOutputStram,完成后查看其大小,然后把該值放入Content-Length頭,最后通過byteArrayStream.writeTo(response.getOutputStream()發送內容;

        Content-Type: 表示后面的文檔屬於什么MIME類型。Servlet默認為text/plain,但通常需要顯式地指定為text/html。由於經常要設置Content-Type,因此HttpServletResponse提供了一個專用的方法setContentTyep。 可在web.xml文件中配置擴展名和MIME類型的對應關系;

        Date:當前的GMT時間。你可以用setDateHeader來設置這個頭以避免轉換時間格式的麻煩;

        Expires:指明應該在什么時候認為文檔已經過期,從而不再緩存它。

        Last-Modified:文檔的最后改動時間。客戶可以通過If-Modified-Since請求頭提供一個日期,該請求將被視為一個條件GET,只有改動時間遲於指定時間的文檔才會返回,否則返回一個304(Not Modified)狀態。Last-Modified也可用setDateHeader方法來設置;

        Location:表示客戶應當到哪里去提取文檔。Location通常不是直接設置的,而是通過HttpServletResponse的sendRedirect方法,該方法同時設置狀態代碼為302;

        Refresh:表示瀏覽器應該在多少時間之后刷新文檔,以秒計。除了刷新當前文檔之外,你還可以通過setHeader("Refresh", "5; URL=http://host/path")讓瀏覽器讀取指定的頁面。注意這種功能通常是通過設置HTML頁面HEAD區的<META HTTP-EQUIV="Refresh" CONTENT="5;URL=http://host/path">實現,這是因為,自動刷新或重定向對於那些不能使用CGI或Servlet的HTML編寫者十分重要。但是,對於Servlet來說,直接設置Refresh頭更加方便。注意Refresh的意義是“N秒之后刷新本頁面或訪問指定頁面”,而不是“每隔N秒刷新本頁面或訪問指定頁面”。因此,連續刷新要求每次都發送一個Refresh頭,而發送204狀態代碼則可以阻止瀏覽器繼續刷新,不管是使用Refresh頭還是<META HTTP-EQUIV="Refresh" ...>。注意Refresh頭不屬於HTTP 1.1正式規范的一部分,而是一個擴展,但Netscape和IE都支持它。

 

  到這里對於新手來說就大概明了吧也還可以延伸看看另一篇https://www.cnblogs.com/lwh-note/p/9519963.html,如果還有興趣就可以去了解下文件傳輸協議FTP、電子郵件傳輸協議SMTP、域名系統服務DNS、網絡新聞傳輸協議NNTP和HTTP協議等,並理解下代理(Proxy)、網關(Gateway)和通道(Tunnel)也都是較基礎的內容的,好吧,繼續加油撒!

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM