.Net(c#)漢字和Unicode編碼互相轉換

本文轉載自查看原文 2015-01-27 14:01 7632 C#/ 編碼

{"Tilte": "\u535a\u5ba2\u56ed", "Href": "http://www.cnblogs.com"}

經常遇到這樣內容的json字符串，原來是把其中的漢字做了Unicode編碼轉換。

Unicode編碼：

　　將漢字進行UNICODE編碼，如：“王”編碼后就成了“\王”，UNICODE字符以\u開始，后面有4個數字或者字母，所有字符都是16進制的數字，每兩位表示的256以內的一個數字。而一個漢字是由兩個字符組成，於是就很容易理解了，“738b”是兩個字符，分別是“73”“8b”。但是在將 UNICODE字符編碼的內容轉換為漢字的時候，字符是從后面向前處理的，所以，需要把字符按照順序“8b”“73”進行組合得到漢字。

Unicode/漢字互轉實現：

/// <summary>
/// <summary>
/// 字符串轉Unicode
/// </summary>
/// <param name="source">源字符串</param>
/// <returns>Unicode編碼后的字符串</returns>
public static string String2Unicode(string source)
{
    byte[] bytes = Encoding.Unicode.GetBytes(source);
    StringBuilder stringBuilder = new StringBuilder();
    for (int i = 0; i < bytes.Length; i += 2)
    {
        stringBuilder.AppendFormat("\\u{0}{1}", bytes[i + 1].ToString("x").PadLeft(2, '0'), bytes[i].ToString("x").PadLeft(2, '0'));
    }
    return stringBuilder.ToString();
}

/// <summary>
/// Unicode轉字符串
/// </summary>
/// <param name="source">經過Unicode編碼的字符串</param>
/// <returns>正常字符串</returns>
public static string Unicode2String(string source)
{
    return new Regex(@"\\u([0-9A-F]{4})", RegexOptions.IgnoreCase | RegexOptions.Compiled).Replace(
                 source, x => string.Empty + Convert.ToChar(Convert.ToUInt16(x.Result("$1"), 16)));
}

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 .Net(C#)漢字和Unicode編碼互相轉換 C#怎么判斷字符是不是漢字漢字和Unicode編碼互相轉換 C#漢字轉為Unicode編碼 C#漢字轉為Unicode編碼 C# - 漢字與unicode之間的轉換 .net unicode漢字互相轉換 C# 實現十六進制Unicode編碼字符串轉換為漢字 C#_漢字與GBK,Unicode,UTF-8編碼之間的轉換 C#中文和UNICODE編碼轉換 Unicode轉換成漢字的C#解碼代碼