轉:http://blog.csdn.net/scyatcs/article/details/31356823
編碼問題存在兩個方面:JVM之內和JVM之外。
1、Java文件編譯后形成class
這里Java文件的編碼可能有多種多樣,但Java編譯器會自動將這些編碼按照Java文件的編碼格式正確讀取后產生class文件,這里的class文件編碼是Unicode編碼(具體說是UTF-16編碼)。
因此,在Java代碼中定義一個字符串:
String s="漢字";
不管在編譯前java文件使用何種編碼,在編譯后成class后,他們都是一樣的----Unicode編碼表示。
2、JVM中的編碼
JVM加載class文件讀取時候使用Unicode編碼方式正確讀取class文件,那么原來定義的String s="漢字";在內存中的表現形式是Unicode編碼。