http協議之Transfer-Encoding及HttpCore實現


Transfer-Encoding簡介

transfer-eccoding所描述的是消息請求(request)和響應(response)所附帶的實體對象(entity)的傳輸形式,規范定義格式如下:

Transfer-Encoding = "Transfer-Encoding" ":" 1#transfer-coding 

  舉個例子:Transfer-Encoding: chunked

transfer-encoding的可選值有:chunked,identity ;
transfer-encoding的可選值有:chunked,identity,從字面意義可以理解,前者指把要發送傳輸的數據切割成一系列的塊數據傳輸,后者指傳輸時不做任何處理,自身的本質數據形式傳輸。舉個例子,如果我們要傳輸一本“紅樓夢”小說到服務器,chunked方式就會先把這本小說分成一章一章的,然后逐個章節上傳,而identity方式則是從小說的第一個字按順序傳輸到最后一個字結束。

相關的頭定義

Content-Encoding : content-encoding和transfer-encoding所作用的對象不同,行為目標也不同,前者是對數據內容采用什么樣的編碼方式,后者是對數據傳輸采用什么樣的編碼。前者通常是對數據內容進行一些壓縮編碼操作,后者通常是對傳傳輸采用分塊策略之類的。

Content-length : content-length頭的作用是指定待傳輸的內容的字節長度。比如上面舉的例子中,我們要上傳一本紅樓夢小說,則可以指定其長度大小,如:content-length:731017。細心的讀者可能會有疑惑,它和transfer-encoding又有什么關系呢?如果想知道它們的關系,只要反過來問下自己,為什么transfer-encoding會有identity和chunked兩種,各在什么上下文情景中要用到。比如chunked方式,把數據分塊傳輸在很多地方就非常有用,如服務端在處理一個復雜的問題時,其返回結果是階段性的產出,不能一次性知道最終的返回的總長度(content-lenght值),所以這時候返回頭中就不能有content-lenght頭信息,有也要忽略處理。所以你可以這樣理解,transfer-encoding在不能一次性確定消息實體(entity)內容時自定義一些傳輸協議,如果能確定的話,則可以在消息頭中加入content-length頭信息指示其長度,可以把transfer-encoding和content-length看成互斥性的兩種頭。

 transfer-encoding詳解

chunked格式(rfc2616 3.6.1):

Chunked-Body = *chunk
          last-chunk
          trailer
          CRLF
chunk
= chunk-size [ chunk-extension ] CRLF
          chunk-data CRLF
chunk-size
= 1*HEX
last-chunk
= 1*("0") [ chunk-extension ] CRLF
chunk-extension
= *( ";" chunk-ext-name [ "=" chunk-ext-val ] )
chunk-ext-name
= token
chunk-ext-val
= token | quoted-string
chunk-data
= chunk-size(OCTET)
trailer
= *(entity-header CRLF)

還是以上傳“紅樓夢”這本書舉例:

 24E5是指第一個塊數據長度為24E5(16進制格式字符串表示),CRLF為換行控制符。緊接着是第一個塊數據內容,其長度就是上面定義的24E5,以CRLF標志結束。3485是指第二塊數據長度為3485,CRLF結束,然后后面是第二塊的數據內容......,以這樣的格式直到所有的塊數據結束。最后以“0”CRLF結束,表示數據傳輸完成(這里對比rfc規范內容,省略了chunk-extensiontrailer的東西,因為這並不重要)。

 

public class Main {

/** * @param args
*/ public static final int CR = 13; // <US-ASCII CR, carriage return (13)> public static final int LF = 10; // <US-ASCII LF, linefeed (10)> public static void main(String[] args) throws Exception{
Socket socket
= new Socket("localhost",8080);
OutputStream out
= socket.getOutputStream();
InputStream in
= socket.getInputStream();

//send requestline out.write("POST /web/Hello HTTP/1.1".getBytes());
out.write(CR
& 0xFF);
out.write(LF
& 0xFF);

//send request header out.write("Host:localhost:8080".getBytes());
out.write(CR
& 0xFF);
out.write(LF
& 0xFF);
out.write(
"Accept-Encoding:gzip,deflate".getBytes());
out.write(CR
& 0xFF);
out.write(LF
& 0xFF);
out.write(
"Transfer-Encoding:chunked".getBytes());// 指定transfer-encodeing為chunked方式 out.write(CR & 0xFF);
out.write(LF
& 0xFF);
out.write(
"Content-Type:application/x-www-form-urlencoded;charset=utf-8".getBytes());
out.write(CR
& 0xFF);
out.write(LF
& 0xFF);

// CRLF between headers and entity out.write(CR & 0xFF);
out.write(LF
& 0xFF);

/* * send chunked data */ //send the first chunked data:hello,world
//the first chunked data's size : 11 out.write("B".getBytes());
out.write(CR
& 0xFF);
out.write(LF
& 0xFF);
//the first chunked data's content : hello,world out.write("hello,world".getBytes());
out.write(CR
& 0xFF);
out.write(LF
& 0xFF);
//send the second chunked data:tony
//the first chunked data's size : 4 out.write("4".getBytes());
out.write(CR
& 0xFF);
out.write(LF
& 0xFF);
//the first chunked data's content : hello,world out.write("tony".getBytes());
out.write(CR
& 0xFF);
out.write(LF
& 0xFF);
//send the chunked data end flag out.write("0".getBytes());
out.write(CR
& 0xFF);
out.write(LF
& 0xFF);
//send CRLF out.write(CR & 0xFF);
out.write(LF
& 0xFF);

out.flush();

//
byte[] buffer = new byte[512];
ByteArrayOutputStream bufferStream
= new ByteArrayOutputStream();
int len = -1;
while((len = in.read(buffer)) != -1){
bufferStream.write(buffer,
0,len);
}

System.out.println(
new String(bufferStream.toByteArray()));

socket.close();

}

 上面這段代碼發了兩塊數據,第一塊是“hello,world”這11個字節長度的字符,第二塊發送了“tony”四個字長的數據塊。在服務端將收到“hello,worldtony”這個字符串.

HttpCore對transfer-encoding的實現

所以不管是對輸入流(InputStream),還是輸出流(OutputStream),httpcore都有三種實現:contentlength,identity,chunked。這是完全按照http規范實現的。這里再重復總結下這三種這間的關系。
當指定了"content-length"頭信息時,說明已經確定消息體(entity)的長度大小,其值必需為非負整數。反之,如果有“transfer-encoding”頭信息時,其值為“chunked”或者“identity”,說明不確定消息體的大小,這時應該不存在“content-length”頭。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM