英文字母和中文漢字在不同字符集編碼下的字節數


英文字母:

字節數 : 1;編碼:GB2312

字節數 : 1;編碼:GBK

字節數 : 1;編碼:GB18030

字節數 : 1;編碼:ISO-8859-1

字節數 : 1;編碼:UTF-8

字節數 : 4;編碼:UTF-16

字節數 : 2;編碼:UTF-16BE

字節數 : 2;編碼:UTF-16LE

 

中文漢字:

字節數 : 2;編碼:GB2312

字節數 : 2;編碼:GBK

字節數 : 2;編碼:GB18030

字節數 : 1;編碼:ISO-8859-1

字節數 : 3;編碼:UTF-8

字節數 : 4;編碼:UTF-16

字節數 : 2;編碼:UTF-16BE

字節數 : 2;編碼:UTF-16LE

可以通過代碼看出以上結果:

import java.io.UnsupportedEncodingException;

 

public class EncodingTest {

 

/**

* @param args

*/

public static void main(String[] args) {

String en = "A";

String ch = "人";

System.out.println("英文字母:" + en);

printByteLength(en, "GB2312");

printByteLength(en, "GBK");

printByteLength(en, "GB18030");

printByteLength(en, "ISO-8859-1");

printByteLength(en, "UTF-8");

printByteLength(en, "UTF-16");

printByteLength(en, "UTF-16BE");

printByteLength(en, "UTF-16LE");

System.out.println();

 

System.out.println("中文漢字:" + ch);

printByteLength(ch, "GB2312");

printByteLength(ch, "GBK");

printByteLength(ch, "GB18030");

printByteLength(ch, "ISO-8859-1");

printByteLength(ch, "UTF-8");

printByteLength(ch, "UTF-16");

printByteLength(ch, "UTF-16BE");

printByteLength(ch, "UTF-16LE");

}

 

/**

* 打印不同字符集下Java字符串所占的字節數

* @param str

*            待操作的字符串

* @param encodingName

*            字符集名稱

* */

public static void printByteLength(String str, String encodingName) {

System.out.print("字節數 : ");

try {

System.out.print(str.getBytes(encodingName).length);

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

}

System.out.println(";編碼:" + encodingName);

}

}


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM