原文鏈接:http://www.west263.com/www/info/22308-1.htm
在xml中,所有的數據都是以文本的形式來顯示,但是二進制數據不能直接以文本格式來表示,那xml又是怎么處理二進制數據的呢?下面就來探討一下。
為了簡單和通用性,xml被設計成了以文本的格式來表示數據。在xml中,所有的數據都是以文本的格式來存儲,二進制數據也不例外。在xml中,二進制數據也要被編碼成文本的格式,發送到目的方。目的方接收到這個文本二進制數據以后,再以相同的解碼程序解成相應的二進制數據,當然數據原來的格式,名稱等輔助信息一定要當作相關信息一起發送。一般二進制數據編碼成base64格式,它的優點是容易易於編碼和解碼,缺點是比純的二進制多占用33%的存儲空間。下面是具體的程序實現:
<%@ page contenttype="text/html; charset=gb2312" %>
<%@ page import="java.io.*" %>
<%
string ret=new string();
try{
inputstream in=new fileinputstream("c:\\aaa.doc");
byte[] bytes=new byte[in.available()];
in.read(bytes);
ret=new sun.misc.base64encoder().encode(bytes); //具體的編碼方法
in.close();
}
catch(filenotfoundexception e) {
e.printstacktrace();
}
catch(java.io.ioexception ex) {
ex.printstacktrace();
}
%>
ret就是最后的結果,編碼以后就可以用標准的xml方式發送了。發送到目的方以后,還要對數據進行相應的解碼,才能得到原來的二進制文件,解碼的代碼如下:
<%@ page contenttype="text/html; charset=gb2312" %>
<%@ page import="java.io.*" %>
<%
byte[] bytes = new sun.misc.base64decoder().decodebuffer(ret);
java.io.bytearrayinputstream instream=new java.io.bytearrayinputstream(bytes);
byte[] buffer =new byte[1444];
fileoutputstream fs=new fileoutputstream( "d:\\aaa.doc");
int bytesum=0;
int byteread=0;
while ((byteread=instream.read(buffer))!=-1) {
bytesum+=byteread;
fs.write(buffer,0,byteread);
}
%>
base64可以處理不太大的數據,如果要移動大量的數據,且要考慮空間/時間效率時,要采用其他的替代方法。
小龍評論:xml是一種很友好的數據存儲介質,如果能實現二進制數據的處理,再加上本身對文本的支持,基本上就能應付常見的數據格式了,一些數據交換中間件巧妙的運用了xml的特性,實現了數據跨平台的傳輸