ANSI, UNICODE,UTF8編碼的區別


本地化過程中涉及到源文件和目標文件的傳輸問題,這時候編碼就顯得很重要。中文的網頁和操作系統中通常采用ANSI編碼,這也是微軟OS的一個字符標准。對於ANSI,不同的國家和地區制定了不同的標准,由此產生了GB2312(簡體中文),BIG5(繁體中文),JIS(日文)等各自的編碼標准。但不同的ANSI編碼在不同語言之間是不兼容的,所以對於不同的操作系統之間文件的傳輸,或者在同樣的操作系統下,源文件語言不同於OS的語言文件的傳輸,需要轉換成UT8格式

 

具體區別:

ANSI:16384個字符。這就是ANSI字符標准。英文一個字節,中文兩個字節

UNICODE: 使用兩個字節對世界上幾乎所有的語言進行編碼0x00000xFFFF),65536個字符,每種語言的代碼段不 同,兩個字節(英文、中文都是兩個字節)所表達的字符是唯一的,所以不同語種可以共存於文本中,解決國際化的問題

UTF8Unicode一種壓縮形式,英文Aunicode中表示為0x0041,老外覺得這種存儲方式太浪費,因為浪費了50%的空間,於是就把英文壓縮成1個字節,成了utf8編碼,但是漢字在utf8中占3個字節,顯然用做中文不如 ansi合算,這就是中國的網頁用作ansi編碼而老外的網頁常用utf8的原因。

在英文OS中,要在control and panel settings- regional and language options,standards and formats設成english的。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM