字符流、字節流、二進制及其在HTTP協議傳輸


一、二進制、字節、字符流概念

字(Byte)節是長度單位。位(bit)也是長度單位。
計算機通信和存儲的時候都是以010101這樣的二進制數據為基礎的
二進制數有兩個特點:它由兩個基本字符0,1組成,二進制數運算規律是逢二進一。
在程序中所有的數據都是以流的方式進行傳輸或保存的,程序需要數據的時候要使用輸入流讀取數據,而當程序需要將一些數據保存起來的時候,就要使用輸出流完成。
程序中的輸入輸出都是以流的形式保存的,流中保存的實際上全都是字節文件。
在java.io包中操作文件內容的主要有兩大類:字節流、字符流,兩類都分為輸入和輸出操作。在字節流中輸出數據主要是使用OutputStream完成,輸入使的是InputStream,在字符流中輸出主要是使用Writer類完成,輸入流主要使用Reader類完成。(這四個都是抽象類)
java中提供了專用於輸入輸出功能的包Java.io,其中包括:
InputStream,OutputStream,Reader,Writer
InputStream 和OutputStream,兩個是為字節流設計的,主要用來處理字節或二進制對象,
Reader和 Writer.兩個是為字符流(一個字符占兩個字節)設計的,主要用來處理字符或字符串.
字符流處理的單元為2個字節的Unicode字符,分別操作字符、字符數組或字符串,而字節流處理單元為1個字節,操作字節和字節數組。所以字符流是由Java虛擬機將字節轉化為2個字節的Unicode字符為單位的字符而成的,所以它對多國語言支持性比較好!如果是音頻文件、圖片、歌曲,就用字節流好點,如果是關系到中文(文本)的,用字符流好點
所有文件的儲存是都是字節(byte)的儲存,在磁盤上保留的並不是文件的字符而是先把字符編碼成字節,再儲存這些字節到磁盤。在讀取文件(特別是文本文件)時,也是一個字節一個字節地讀取以形成字節序列
字節流可用於任何類型的對象,包括二進制對象,而字符流只能處理字符或者字符串; 2. 字節流提供了處理任何類型的IO操作的功能,但它不能直接處理Unicode字符,而字符流就可以
字節流是最基本的,所有的InputStrem和OutputStream的子類都是,主要用在處理二進制數據,它是按字節來處理的 但實際中很多的數據是文本,又提出了字符流的概念,它是按虛擬機的encode來處理,也就是要進行字符集的轉化 這兩個之間通過 InputStreamReader,OutputStreamWriter來關聯,實際上是通過byte[]和String來關聯 在實際開發中出現的漢字問題實際上都是在字符流和字節流之間轉化不統一而造成的。

二、HTTP協議數據傳輸

通常上的理解,http協議中請求、相應都是以ascii字符方式傳輸,如果要傳輸二進制需要經過BASE64或MIME等編碼(因為HTTP協議pop3、smtp郵件協議都是針對文本的,而FTP支持傳輸二進制數據,即不需要經過編碼轉換成字符型數據)

如果直接使用http傳輸二進制(不經過base64編碼),可能會造成一下問題:

1) 不知道傳輸字節的具體長度,如傳輸的int類型,將int類型之間轉為char以后,丟失掉了長度的信息,如數字1234567,本來只有4個字節,但是轉化成文本的“1234567”是有7個字節。在int類型的時候固然好辦,但是一個數組的時候,經過轉化以后,在轉化回來就很麻煩了。

2) 對於一些數字,二進制傳輸Server是沒法處理的。如int 1,二進制數據是0x00000001,按字節傳輸的時候,client能夠正常發送,但是libevent收到以后,在拋給libevent_http層是,會把數據截斷,前兩位0x00是字符串的停止符。

HTTP請求頭和響應頭都是以ASCII文本方式傳輸的,但是傳輸內容(請求響應體)可能是多種形式的。接收方處理數據時是根據請求頭/響應頭中的content-type屬性來處理的。 Content-Type:image/gif 這說明傳輸的是一個image對象(二進制數據),該對象為gif格式,Content-length:91 這說明傳輸的數據大小為91個字節,響應頭若沒有Transfer-Encoding這個字段,說明傳輸的數據沒有經過任何形式的編碼轉換,傳輸的就是源文件的內容。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM