ANSI, UNICODE,UTF8編碼的區別

本文轉載自查看原文 2012-09-18 15:06 4266 C#.net

本地化過程中涉及到源文件和目標文件的傳輸問題，這時候編碼就顯得很重要。中文的網頁和操作系統中通常采用ANSI編碼，這也是微軟OS的一個字符標准。對於ANSI，不同的國家和地區制定了不同的標准，由此產生了GB2312（簡體中文），BIG5（繁體中文），JIS（日文）等各自的編碼標准。但不同的ANSI編碼在不同語言之間是不兼容的，所以對於不同的操作系統之間文件的傳輸，或者在同樣的操作系統下，源文件語言不同於OS的語言文件的傳輸，需要轉換成UT8格式。

具體區別：

ANSI:16384個字符。這就是ANSI字符標准。英文一個字節，中文兩個字節

UNICODE：使用兩個字節對世界上幾乎所有的語言進行編碼（0x0000－0xFFFF），65536個字符，每種語言的代碼段不同，兩個字節(英文、中文都是兩個字節)所表達的字符是唯一的，所以不同語種可以共存於文本中，解決國際化的問題

UTF8是Unicode一種壓縮形式，英文A在unicode中表示為0x0041，老外覺得這種存儲方式太浪費，因為浪費了50%的空間，於是就把英文壓縮成1個字節，成了utf8編碼，但是漢字在utf8中占3個字節，顯然用做中文不如 ansi合算，這就是中國的網頁用作ansi編碼而老外的網頁常用utf8的原因。

在英文OS中，要在control and panel settings- regional and language options，standards and formats設成english的。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Ansi,UTF8,Unicode,ASCII編碼的差別 Ansi,UTF8,Unicode編碼（續）字符編碼ANSI和ASCII區別、Unicode和UTF-8區別 c++ ANSI、UNICODE、UTF8互轉關於ANSI,unicode與utf-8的區別趣談unicode，ansi，utf-8，unicode big endian這些編碼有什么區別字符串處理 - ANSI - Unicode - UTF8 轉換 Windows 記事本的 ANSI、Unicode、UTF-8 這三種編碼模式有什么區別？ [轉]Unicode utf8等編碼類型的原理 GBK、UTF8、UNICODE編碼轉換