.net C#实现中文转Unicode、Unicode转中文及与js对应关系

本文转载自查看原文 2012-12-26 10:00 3579 Web

中文转Unicode：HttpUtility.UrlEncodeUnicode(string str);
转换后中文格式："%uxxxx" 举例："柳_abc123" 转换结果是："%u67f3_abc123"

Unicode转中文1：HttpUtility.UrlDecode(string str);
str格式："%uxxxx" ，举例："%u67f3_abc123"

Unicode转中文2：Regex.Unescape(string str);
str格式："\uxxxx" ，举例："\u67f3_abc123"

参考资料：http://hi.baidu.com/eegcn/blog/item/7315f799a2e57f136f068c55.html

1.window.escape()与HttpUtility.UrlEncodeUnicode()编码格式一样：将一个汉字编码为%uxxxx格式
不会被window.escape编码的字符有：@ _ - . * / + 这与http://www.w3school.com.cn/js/jsref_escape.asp上的解释不符合

2.window.encodeURIComponent()与HttpUtility.UrlEncode()编码格式一样：将一个汉字编码为%xx%xx%xx的格式

不会被window.encodeURIComponent编码的字符有：'()*-._!~ 这与http://www.w3school.com.cn/js/jsref_encodeURIComponent.asp解释相符合

不会被HttpUtility.UrlEncode编码的字符有：'()*-._!相比较而言，HttpUtility.UrlEncode比window.encodeURIComponent多一个 ~ 编码

3.不会被window.encodeURI编码的字符有：-_.!*();/?:@&=$,# 与encodeURIComponent对比，发现encodeURI不对：;/?:@&=+$,#这些用于分隔 URI 组件的标点符号进行编码

Asp.Net编码与JS编码的区别：

1. 不会被HttpUtility.UrlEncodeUnicode编码的字符与不会被HttpUtility.UrlEncode编码的字符一样，而escape和encodeURIComponent不编码的字符不一样

2. HttpUtility.UrlEncode和HttpUtility.UrlEncodeUnicode会对/编码，而escape和encodeURIComponent会对/编码，encodeURI不会对/编码

3. HttpUtility.UrlEncode()和HttpUtility.UrlEncodeUnicode()会把空格编码为 +，而escape，encodeURIComponent，encodeURI都会将空格编码为%20

同时有位仁兄在http://hi.baidu.com/zkbob22/blog/item/9159cf96768b587955fb9684.html留言里提到：

Unicode到中文： HttpUtility.UrlDecode、Regex.Unescape、Encoding.Unicode.GetString(Encoding.Unicode.GetBytes())、Encoding.Convert
中文到Unicode：HttpUtility.UrlEncodeUnicode、Encoding.Convert

转载的测试方法：

同样的Server.UrlEncode在不同页面居然编码后的字符不同，后来查了查原来..

在对URL进行编码时，该用哪一个？这两都使用上有什么区别吗？
测试：
string file="文件上（传）篇.doc";
string Server_UrlEncode=Server.UrlEncode(file);
string Server_UrlDecode=Server.UrlDecode(Server_UrlEncode);
string HttpUtility_UrlEncode=System.Web.HttpUtility.UrlEncode(file);
string HttpUtility_UrlDecode=System.Web.HttpUtility.UrlDecode(HttpUtility_UrlEncode);
Response.Write("原数据："+file);
SFun.WriteLine("Server.UrlEncode："+Server_UrlEncode);
SFun.WriteLine("Server.UrlDecode："+Server_UrlDecode);
SFun.WriteLine("HttpUtility.UrlEncode："+HttpUtility_UrlEncode);
SFun.WriteLine("HttpUtility.UrlDecode："+HttpUtility_UrlDecode);

输出：
原数据：文件上（传）篇.doc
Server.UrlEncode：%ce%c4%bc%fe%c9%cf%a3%a8%b4%ab%a3%a9%c6%aa.doc
Server.UrlDecode：文件上（传）篇.doc
HttpUtility.UrlEncode：%e6%96%87%e4%bb%b6%e4%b8%8a%ef%bc%88%e4%bc%a0%ef%bc%89%e7%af%87.doc
HttpUtility.UrlDecode：文件上（传）篇.doc

区别在于：HttpUtility.UrlEncode()默认是以UTF8对URL进行编码，而Server.UrlEncode()则以默认的编码对URL进行编码。

在用 ASP.Net 开发页面的时候, 我们常常通过 System.Web.HttpUtility.UrlEncode 和 UrlDecode 在页面间通过 URL 传递参数. 成对的使用 Encode 和 Decode 是没有问题的.

但是, 我们在编写文件下载的页面的时候, 常常用如下方法来指定下载的文件的名称:
Response.AddHeader("Content-Disposition","attachment; filename="
+ HttpUtility.UrlEncode(fileName, Encoding.UTF8));
之所以转换成 UTF8 是为了支持中文文件名.

这时候问题就来了, 因为 HttpUtility.UrlEncode 在 Encode 的时候, 将空格转换成加号('+'), 在 Decode 的时候将加号转为空格, 但是浏览器是不能理解加号为空格的, 所以如果文件名包含了空格, 在浏览器下载得到的文件, 空格就变成了加号.

一个解决办法是, 在 HttpUtility 的 UrlEncode 之后, 将 "+" 替换成 "%20"( 如果原来是 "+" 则被转换成 "%2b" ) , 如:
fileName = HttpUtility.UrlEncode(fileName, Encoding.UTF8);
fileName = fileName.Replace("+", "%20");
不明白微软为什么要把空格转换成加号而不是"%20". 记得 JDK 的 UrlEncoder 是将空格转换成 "%20"的.
经检查, 在 .Net 2.0 也是这样.

上面是从别的地方拷贝的，写得很好，我自己的一个程序中也遇到同样的问题，默认aspx是以utf-8为编码的，在我这个程序中必须用gb2312为默认编码（<globalization requestEncoding="gb2312" responseEncoding="gb2312"/>），问题出现了，以前没有问题的HttpUtility.UrlDecode在 Page.Request回的值是乱码这就是上面说的HttpUtility.UrlDecode默认以UTF8对URL进行编码，这种情况下面只需将 HttpUtility.UrlDecode改成Server.UrlEncode即可

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 C# unicode 转中文 JS Unicode转中文,中文转Unicode,ASCII转Unicode,Unicode转ASCII java 中文转Unicode 以及 Unicode转中文 unicode转中文的方法中文转unicode，中文转bytes，unicode转bytes java实现 JAVA方法：Unicode转中文/中文转Unicode Oracle Unicode转中文（解码） Python3 Unicode转中文 c#将http调用返回额json中的有关中文的unicode转换为中文（转） C# Unicode与中文互转

.net C#实现 中文转Unicode、Unicode转中文 及与js对应关系

免责声明！

.net C#实现中文转Unicode、Unicode转中文及与js对应关系