本地化過程中涉及到源文件和目標文件的傳輸問題,這時候編碼就顯得很重要。中文的網頁和操作系統中通常采用ANSI編碼,這也是微軟OS的一個字符標准。對於ANSI,不同的國家和地區制定了不同的標准,由此產生了GB2312(簡體中文),BIG5(繁體中文),JIS(日文)等各自的編碼標准。但不同的ANSI編碼在不同語言之間是不兼容的,所以對於不同的操作系統之間文件的傳輸,或者在同樣的操作系統下,源文件語言不同於OS的語言文件的傳輸,需要轉換成UT8格式。
具體區別:
ANSI:16384個字符。這就是ANSI字符標准。英文一個字節,中文兩個字節
UNICODE: 使用兩個字節對世界上幾乎所有的語言進行編碼(0x0000-0xFFFF),65536個字符,每種語言的代碼段不 同,兩個字節(英文、中文都是兩個字節)所表達的字符是唯一的,所以不同語種可以共存於文本中,解決國際化的問題
UTF8是Unicode一種壓縮形式,英文A在unicode中表示為0x0041,老外覺得這種存儲方式太浪費,因為浪費了50%的空間,於是就把英文壓縮成1個字節,成了utf8編碼,但是漢字在utf8中占3個字節,顯然用做中文不如 ansi合算,這就是中國的網頁用作ansi編碼而老外的網頁常用utf8的原因。
在英文OS中,要在control and panel settings- regional and language options,standards and formats設成english的。