.net C#實現中文轉Unicode、Unicode轉中文及與js對應關系

本文轉載自查看原文 2012-12-26 10:00 3579 Web

中文轉Unicode：HttpUtility.UrlEncodeUnicode(string str);
轉換后中文格式："%uxxxx" 舉例："柳_abc123" 轉換結果是："%u67f3_abc123"

Unicode轉中文1：HttpUtility.UrlDecode(string str);
str格式："%uxxxx" ，舉例："%u67f3_abc123"

Unicode轉中文2：Regex.Unescape(string str);
str格式："\uxxxx" ，舉例："\u67f3_abc123"

參考資料：http://hi.baidu.com/eegcn/blog/item/7315f799a2e57f136f068c55.html

1.window.escape()與HttpUtility.UrlEncodeUnicode()編碼格式一樣：將一個漢字編碼為%uxxxx格式
不會被window.escape編碼的字符有：@ _ - . * / + 這與http://www.w3school.com.cn/js/jsref_escape.asp上的解釋不符合

2.window.encodeURIComponent()與HttpUtility.UrlEncode()編碼格式一樣：將一個漢字編碼為%xx%xx%xx的格式

不會被window.encodeURIComponent編碼的字符有：'()*-._!~ 這與http://www.w3school.com.cn/js/jsref_encodeURIComponent.asp解釋相符合

不會被HttpUtility.UrlEncode編碼的字符有：'()*-._!相比較而言，HttpUtility.UrlEncode比window.encodeURIComponent多一個 ~ 編碼

3.不會被window.encodeURI編碼的字符有：-_.!*();/?:@&=$,# 與encodeURIComponent對比，發現encodeURI不對：;/?:@&=+$,#這些用於分隔 URI 組件的標點符號進行編碼

Asp.Net編碼與JS編碼的區別：

1. 不會被HttpUtility.UrlEncodeUnicode編碼的字符與不會被HttpUtility.UrlEncode編碼的字符一樣，而escape和encodeURIComponent不編碼的字符不一樣

2. HttpUtility.UrlEncode和HttpUtility.UrlEncodeUnicode會對/編碼，而escape和encodeURIComponent會對/編碼，encodeURI不會對/編碼

3. HttpUtility.UrlEncode()和HttpUtility.UrlEncodeUnicode()會把空格編碼為 +，而escape，encodeURIComponent，encodeURI都會將空格編碼為%20

同時有位仁兄在http://hi.baidu.com/zkbob22/blog/item/9159cf96768b587955fb9684.html留言里提到：

Unicode到中文： HttpUtility.UrlDecode、Regex.Unescape、Encoding.Unicode.GetString(Encoding.Unicode.GetBytes())、Encoding.Convert
中文到Unicode：HttpUtility.UrlEncodeUnicode、Encoding.Convert

轉載的測試方法：

同樣的Server.UrlEncode在不同頁面居然編碼后的字符不同，后來查了查原來..

在對URL進行編碼時，該用哪一個？這兩都使用上有什么區別嗎？
測試：
string file="文件上（傳）篇.doc";
string Server_UrlEncode=Server.UrlEncode(file);
string Server_UrlDecode=Server.UrlDecode(Server_UrlEncode);
string HttpUtility_UrlEncode=System.Web.HttpUtility.UrlEncode(file);
string HttpUtility_UrlDecode=System.Web.HttpUtility.UrlDecode(HttpUtility_UrlEncode);
Response.Write("原數據："+file);
SFun.WriteLine("Server.UrlEncode："+Server_UrlEncode);
SFun.WriteLine("Server.UrlDecode："+Server_UrlDecode);
SFun.WriteLine("HttpUtility.UrlEncode："+HttpUtility_UrlEncode);
SFun.WriteLine("HttpUtility.UrlDecode："+HttpUtility_UrlDecode);

輸出：
原數據：文件上（傳）篇.doc
Server.UrlEncode：%ce%c4%bc%fe%c9%cf%a3%a8%b4%ab%a3%a9%c6%aa.doc
Server.UrlDecode：文件上（傳）篇.doc
HttpUtility.UrlEncode：%e6%96%87%e4%bb%b6%e4%b8%8a%ef%bc%88%e4%bc%a0%ef%bc%89%e7%af%87.doc
HttpUtility.UrlDecode：文件上（傳）篇.doc

區別在於：HttpUtility.UrlEncode()默認是以UTF8對URL進行編碼，而Server.UrlEncode()則以默認的編碼對URL進行編碼。

在用 ASP.Net 開發頁面的時候, 我們常常通過 System.Web.HttpUtility.UrlEncode 和 UrlDecode 在頁面間通過 URL 傳遞參數. 成對的使用 Encode 和 Decode 是沒有問題的.

但是, 我們在編寫文件下載的頁面的時候, 常常用如下方法來指定下載的文件的名稱:
Response.AddHeader("Content-Disposition","attachment; filename="
+ HttpUtility.UrlEncode(fileName, Encoding.UTF8));
之所以轉換成 UTF8 是為了支持中文文件名.

這時候問題就來了, 因為 HttpUtility.UrlEncode 在 Encode 的時候, 將空格轉換成加號('+'), 在 Decode 的時候將加號轉為空格, 但是瀏覽器是不能理解加號為空格的, 所以如果文件名包含了空格, 在瀏覽器下載得到的文件, 空格就變成了加號.

一個解決辦法是, 在 HttpUtility 的 UrlEncode 之后, 將 "+" 替換成 "%20"( 如果原來是 "+" 則被轉換成 "%2b" ) , 如:
fileName = HttpUtility.UrlEncode(fileName, Encoding.UTF8);
fileName = fileName.Replace("+", "%20");
不明白微軟為什么要把空格轉換成加號而不是"%20". 記得 JDK 的 UrlEncoder 是將空格轉換成 "%20"的.
經檢查, 在 .Net 2.0 也是這樣.

上面是從別的地方拷貝的，寫得很好，我自己的一個程序中也遇到同樣的問題，默認aspx是以utf-8為編碼的，在我這個程序中必須用gb2312為默認編碼（<globalization requestEncoding="gb2312" responseEncoding="gb2312"/>），問題出現了，以前沒有問題的HttpUtility.UrlDecode在 Page.Request回的值是亂碼這就是上面說的HttpUtility.UrlDecode默認以UTF8對URL進行編碼，這種情況下面只需將 HttpUtility.UrlDecode改成Server.UrlEncode即可

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 JS Unicode轉中文,中文轉Unicode,ASCII轉Unicode,Unicode轉ASCII C# 版本和.NET 版本以及VS版本的對應關系 C#版本和.NET版本以及VS版本的對應關系 C# Unicode與中文互轉 c#將http調用返回額json中的有關中文的unicode轉換為中文（轉） C#和.Net的關系 C#中文和UNICODE編碼轉換 C#和FrameWork版本對應關系 [記錄] C# 版本和.NET 版本以及VS版本的對應關系 Visual Studio、.NET Framework、VC++、C#各個版本的對應關系

.net C#實現 中文轉Unicode、Unicode轉中文 及與js對應關系

免責聲明！

.net C#實現中文轉Unicode、Unicode轉中文及與js對應關系