Java采用unicode來表示字符,java中的一個char是2個字節,一個中文或英文字符的unicode編碼都占2個字節,但如果采用其他編碼方式,一個字符占用的字節數則各不相同。
在 GB 2312 編碼或 GBK 編碼中,一個英文字母字符存儲需要1個字節,一個漢子字符存儲需要2個字節。
在UTF-8編碼中,一個英文字母字符存儲需要1個字節,一個漢字字符儲存需要3到4個字節。
在UTF-16編碼中,一個英文字母字符存儲需要2個字節,一個漢字字符儲存需要3到4個字節(Unicode擴展區的一些漢字存儲需要4個字節)。
在UTF-32編碼中,世界上任何字符的存儲都需要4個字節。
