C#漢字轉為Unicode編碼


主要用於生成json格式時,將漢字轉成Unicoude編碼,防止頁面亂碼。

protected string GetUnicode(string text)
{
	string result = "";
	for (int i = 0; i < text.Length; i++)
	{
		if ((int)text[i] > 32 && (int)text[i] < 127)
		{
			result += text[i].ToString();
		}
		else
			result += string.Format("\\u{0:x4}", (int)text[i]);
	}
	return result;
}

涉及的知識點:
1、“x”則代表十六進制,“x4”代表十六進制表示的可控制長度,如果長度不夠,則用前導的0填補。
2、Unicode寫法:在表示一個Unicode的字符時,通常會用“U+”然后緊接着一組十六進制的數字來表示這一個字符。
3、 ASCII 碼(American Standard Code for Information Interchange,全稱美國信息交換標准碼)
基本的 ASCII 字符集共有 128 個字符,其中有 96 個可打印字符,包括常用的字母、數字、標點符號等,另外還有 32 個控制字符。
•0~31及127(共33個)是控制字符或通信專用字符(其余為可顯示字符),如控制符:LF(換行)、CR(回車)、FF(換頁)、DEL(刪除)、BS(退格)、BEL(振鈴)等;通信專用字符:SOH(文頭)、EOT(文尾)、ACK(確認)等;ASCII值為8、9、10和13分別轉換為退格、制表、換行和回車字符。它們並沒有特定的圖形顯示,但會依不同的應用程序而對文本顯示有不同的影響。
•32~126(共95個)是字符(32sp是空格),其中48~57為0到9十個阿拉伯數字,65~90為26個大寫英文字母,97~122為26個小寫字母,其余為一些標點符號、運算符號等。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM