\u Unicode和漢字轉化


介紹

\uxxxx這種格式是Unicode寫法,表示一個字符,其中xxxx表示一個16進制數字,范圍所0~65535. Unicode十六進制數只能包含數字0~9、大寫字母A~F或者小寫字母A~F。需要注意到是:Unicode的大小端問題,一般都是小端在前,例如 \u5c0f 表示漢語中的 ''字,轉換成10進制就是9215,所以在byte數組中應該是1592.

漢字轉Unicode

 private string Unicode2Chinese(string strUnicode)
{
    string[] splitString = new string[1];
    splitString[0] = "\\u";
    string[] unicodeArray = strUnicode.Split(splitString, StringSplitOptions.RemoveEmptyEntries);
    StringBuilder sb = new StringBuilder();

    foreach (string item in unicodeArray)
    {
        byte[] codes = new byte[2];
        int code1, code2;
        code1 = Convert.ToInt32(item.Substring(0, 2), 16);
        code2 = Convert.ToInt32(item.Substring(2), 16);
        codes[0] = (byte)code2;//必須是小端在前
        codes[1] = (byte)code1;
        sb.Append(Encoding.Unicode.GetString(codes));
    }

    return sb.ToString();
}

Unicode轉漢字

private string Chinese2Unicode(string strChinese)
{
    string strUnicodes = string.Empty;
    foreach (char item in strChinese.ToCharArray())
    {
        strUnicodes += "\\u" + ((int)item).ToString("x"); //16進制
    }
    return strUnicodes;
}

 

程序截圖:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM