java程序實現Unicode碼和中文互相轉換


 

根據前一篇的補充問題http://blog.csdn.net/fancylovejava/article/details/10142391

有了前一篇文章的了解,大概了解了unicode編碼格式了

ANSI:漢字區的內碼范圍高字節從B0-F7,低字節從A1-FE
Unicode:漢字的Unicode編碼范圍為\u4E00-\u9FA5 \uF900-\uFA2D,如果不在這個范圍內就不是漢字了.

現在程序中遇到的問題是,服務器端發送中文給Android客戶端的時候,android客戶端獲取到字符串然后顯示到界面上,可是顯示的結果是

unicode編碼格式开始兑奖所以呢,這要轉換啊

 

有相關的網站工具轉換unicode編碼和asicc編碼,http://tool.chinaz.com/Tools/Unicode.aspx

 

jdk有一個工具也提供轉換,是native2ascii.exe,在bin目錄下面,直接點開輸入中文就可以了

有篇比較好的文章介紹http://sailinglee.iteye.com/blog/430568

 

可是我們要在程序中將這個些开轉換成中文啊~~~~

String a="開始兌獎";
 System.out.println(a.codePointAt(0));

這個打印出來的是“開”字的开unicode碼的數字部分24320

 

System.out.println((char)24320);

這個打印出來的是將一個數字轉換成一個char類型,這個char類型就是一個代表這個unicode碼的中文字符,

打印出來結果為:開

有了這個就可以將unicode轉換成中文了

 

還有篇文章很好,轉過來http://blog.csdn.net/ocean20/article/details/6743385說明下char這個字符型在Java

java中的char占幾個字節

 

1:“字節”是byte,“位”是bit ;

  2: 1 byte = 8 bit ;

  char 在java中是2個字節。java采用unicode,2個字節(16位)來表示一個字符。

  例子代碼如下:

 

 

[java]  view plain copy
 
 
  1. public class Test {  
  2.   
  3.   
  4.     public static void main(String[] args) {  
  5.         String str= "中";  
  6.         char x ='中';  
  7.         byte[] bytes=null;  
  8.         byte[] bytes1=null;  
  9.         try {  
  10.             bytes = str.getBytes("utf-8");  
  11.             bytes1 = charToByte(x);  
  12.         } catch (UnsupportedEncodingException e) {  
  13.             // TODO Auto-generated catch block  
  14.             e.printStackTrace();  
  15.         }  
  16.         System.out.println("bytes 大小:"+bytes.length);  
  17.         System.out.println("bytes1大小:"+bytes1.length);  
  18.     }  
  19.     public static byte[] charToByte(char c) {   
  20.         byte[] b = new byte[2];   
  21.         b[0] = (byte) ((c & 0xFF00) >> 8);   
  22.         b[1] = (byte) (c & 0xFF);   
  23.         return b;   
  24.     }  
  25. }  

 

運行結果:

bytes 大小:3
bytes1大小:2

  

java是用unicode來表示字符,"中"這個中文字符的unicode就是2個字節。

 String.getBytes(encoding)方法是獲取指定編碼的byte數組表示,

通常gbk/gb2312是2個字節,utf-8是3個字節

如果不指定encoding則取系統默認的encoding。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM