Java 字符轉碼之UTF-8轉為GBK/GB2312

本文轉載自查看原文 2022-01-10 14:58 10081 java

java跟python類似的做法，在java中字符串的編碼是java修改過的一種Unicode編碼，所以看到java中的字符串，心理要默念這個東西是java修改過的一種Unicode編碼的編碼。

package string;

import java.nio.charset.Charset;


public class UTF82GBK {

    public static void main(String[] args) throws Exception {
        //系統的默認編碼是GBK
        System.out.println("Default Charset=" + Charset.defaultCharset());
        String t = "hfjkds中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國中國hfsdkj<img src='sasa' /> fjldsajflkdsjaflkdsjalf <img src='sada' ait=''/>sfdsfadas";  
        //思路：先轉為Unicode，然后轉為GBK
        String utf8 = new String(t.getBytes( "UTF-8"));
        //等同於:
//        String utf8 = new String(t.getBytes( "UTF-8"),Charset.defaultCharset());
        
        System.out.println(utf8);  
        String unicode = new String(utf8.getBytes(),"UTF-8");   
        //等同於:
//        String unicode = new String(utf8.getBytes(Charset.defaultCharset()),"UTF-8");   
        System.out.println(unicode);  
        String gbk = new String(unicode.getBytes("GBK"));  
        //等同於:
//        String gbk = new String(unicode.getBytes("GBK"),Charset.defaultCharset());  
          
        System.out.println(gbk);  
    }

}

java string 的 byte中存儲的其實是 unicode 但是需要進行處理

byte[] bytes = s.getBytes();
        for (byte aByte : bytes) {
            System.out.println("byte十進制:" + (256 + (int)aByte) + ";16進制:" + String.format("%08x", (256 + (int)aByte)));
        }
        System.out.println("------------------------");
        byte[] gbks = s.getBytes("GBK");
        for (byte aByte : gbks) {
            System.out.println("GBK-byte十進制 :" + (256 + (int)aByte) + ";16進制:" + String.format("%08x", (256 + (int)aByte)));
        }

------------
byte十進制:228;16進制:000000e4
byte十進制:184;16進制:000000b8
byte十進制:141;16進制:0000008d
------------------------
GBK-byte十進制 :178;16進制:000000b2
GBK-byte十進制 :187;16進制:000000bb

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Java 字符轉碼之UTF-8轉為GBK/GB2312 Java 字符轉碼之UTF-8轉為GBK/GB2312 字符編碼GBK、GB2312和UTF-8的區別與聯系字符編碼GB2312、GBK、UTF-8的區別字符編碼：GBK、GB2312、UTF-8 GB2312轉碼utf-8字符方法 golang utf-8 轉 gb2312 [轉]各種編碼ANSI、GB2312、GBK、GB18030、UNICODE以及UTF-8傻傻分不清！網絡編碼 GB2312、GBK與UTF-8的區別 python3 之字符串編碼小結（Unicode、utf-8、gbk、gb2312等）

Java 字符轉碼之UTF-8轉為GBK/GB2312

java跟python類似的做法，在java中字符串的編碼是java修改過的一種Unicode編碼，所以看到java中的字符串，心理要默念這個東西是java修改過的一種Unicode編碼的編碼。

java string 的 byte中存儲的其實 是 unicode 但是需要進行處理

免責聲明！

java string 的 byte中存儲的其實是 unicode 但是需要進行處理