java byte[]转String再转回byte[]不一致问题
问题原因 :
new String(byte[])和getBytes()默认使用的编码都是通过这条语句获取的编码
解决原理:
由于UTF-8是多字节编码,需要用多个字节来表示一个字符的编码,所以也就出现了在转换之后byte[]数组长度、内容不一致的情况。
而ISO-8859-1编码是单字节编码,所以使用该编码就不会出现上面的问题
测试代码:
import java.nio.charset.Charset; import java.util.Arrays; public class test { public static void main(String[] args) { byte[] bytes = new byte[] { 41, -31, -91, 41, -71, -11 }; byte[] myBytes = new String(bytes).getBytes(); System.out.println(Arrays.toString(bytes)); System.out.println(Arrays.toString(myBytes)); // 问题原因 :new String(byte[])和getBytes()默认使用的编码都是通过这条语句获取的编码 // 获取默认编码 System.out.println(Charset.defaultCharset().name()); // 解决原理 // 由于UTF-8是多字节编码,需要用多个字节来表示一个字符的编码,所以也就出现了在转换之后byte[]数组长度、内容不一致的情况。 // 而ISO-8859-1编码是单字节编码,所以使用该编码就不会出现上面的问题 byte[] bytes3 = new String(bytes, Charset.forName("ISO-8859-1")).getBytes(Charset.forName("ISO-8859-1")); System.out.println(Arrays.toString(bytes3)); } }
参考文章:https://blog.csdn.net/wusj3/article/details/80606728