『备注』&#x; 格式 的编码转换


在很多 网站(或者很多 WebService),

我们总能看到 Ӓ &#A22A;  这种格式 的编码。

 

如何将这种编码 转换成 实际文本,C#代码如下:

 1 //各种 幺蛾子网页图标 请参见: https://dev.w3.org/html5/html-author/charref
 2 
 3             string str = "中国";
 4             string str2 = "中国";
 5             string str3 = "♣♣♣♣█";
 6 
 7 
 8             string decode = System.Web.HttpUtility.HtmlDecode(str);
 9             Console.WriteLine(decode);  //中国
10             decode = System.Web.HttpUtility.HtmlDecode(str2);
11             Console.WriteLine(decode);  //中国
12             decode = System.Web.HttpUtility.HtmlDecode(str3);
13             Console.WriteLine(decode);  //♣♣♣♣█    //有些 ♣ 格式, 识别不了.
14 
15             Console.WriteLine(System.Web.HttpUtility.HtmlEncode("我爱中国")); //不会被再次转义为 � 格式

 

最后的废话:

> ࢮ 这种编码 是 UTF8 网页编码时用到。

> 这类编码 和   ≶ &tg; 这类编码 基本是 一伙的。

> 但: ࢮ  这类编码 目测毫无价值。

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM