HTTP協議之chunk編碼(分塊傳輸編碼


Transfer-Encoding: chunked 表示輸出的內容長度不能確定,普通的靜態頁面、圖片之類的基本上都用不到這個。

但動態頁面就有可能會用到,但我也注意到大部分asp,php,asp.net動態頁面輸出的時候大部分還是使用Content-Length,沒有使用Transfer-Encoding: chunked。

不過如果結合:Content-Encoding: gzip 使用的時候,Transfer-Encoding: chunked還是比較有用的。

記得以前實現:Content-Encoding: gzip 輸出時,先把整個壓縮后的數據寫到一個很大的字節數組里(如 ByteArrayOutputStream),然后得到數組大小 -> Content-Length。

如果結合Transfer-Encoding: chunked使用,就不必申請一個很大的字節數組了,可以一塊一塊的輸出,更科學,占用資源更少。

這在http協議中也是個常見的字段,用於http傳送過程的分塊技術,原因是http服務器響應的報文長度經常是不可預測的,使用Content-length的實體搜捕並不是總是管用。

          分塊技術的意思是說,實體被分成許多的塊,也就是應用層的數據,TCP在傳送的過程中,不對它們做任何的解釋,而是把應用層產生數據全部理解成二進制流,然后按照MSS的長度切成一分一分的,一股腦塞到tcp協議棧里面去,而具體這些二進制的數據如何做解釋,需要應用層來完成,所以在這之前,一快整體應用層的數據需要等它分成的所有TCP  segment到達對方,重新組裝后,應用程序才使用自己的解碼方法還原它們。

   HTTP1.1采用了持久的連接,也就是一次TCP的連接不馬上釋放,允許許多的請求跟響應在一個TCP的連接上發送,所以客戶機與服務器需要某種方式來標示一個報文在哪里結束和在下一個報文在哪里開始。簡單的方法是使用呢content-length,但這只有當報文長度可以預先判斷的時候才起作用,而對於動態的內容或者在發送數據前不能判定長度的情況下,可以使用分塊的方法來傳送編碼。

如圖:

 

 

Web服務器有時生成HTTPResponse無法在Header就確定消息大小的,這時一般來說服務器將不會提供Content-Length的頭信息,而采用Chunked編碼動態的提供body內容的長度。

 

進行Chunked編碼傳輸的HTTP Response會在消息頭部設置:

Transfer-Encoding: chunked

表示Content Body將用Chunked編碼傳輸內容。

HTTP響應報文中的chunked

Chunked編碼使用若干個Chunk串連而成,由一個標明長度為0的chunk標示結束。每個Chunk分為頭部和正文兩部分,頭部內容指定下一段正文的字符總數(十六進制的數字)和數量單位(一般不寫),正文部分就是指定長度的實際內容,兩部分之間用回車換行(CRLF)隔開。在最后一個長度為0的Chunk中的內容是稱為footer的內容,是一些附加的Header信息(通常可以直接忽略)。

HTTP響應報文中的chunked



這里面只有一個有意義的chunke以及一個footer。第一個chunk,頭部是3134這兩個字節,表示的是1和4這兩個ascii字符,被http協議解釋為十六進制數14,也就是十進制的20。后面緊跟0d0a,再接着是20個字節的chunk正文(圖中的011e~0131)。

后面再接着0d0a,然后就是footer了,30表示ascii字符0,http解釋為長度是0(也說明了這是最后一個chunk),后面緊跟0d0a,然后正文部分為空,再接0d 0a表示結束

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM