ANSI是一種字符代碼,為使計算機支持更多語言,通常使用 0x00~0x7f(即0000 0000~0111 1111)范圍的1 個字節來表示1個英文字符。超出此范圍的使用0x80~0xFFFF(即 1000 0000~1111 1111 1111 1111)來編碼,即擴展的ASCII編碼。
ANSI編碼
為使計算機支持更多語言,通常使用 0x80~0xFFFF 范圍的 2 個字節來表示1個字符。比如:漢字 '中' 在中文操作系統中,使用 [0xD6,0xD0] 這兩個字節存儲。
不同的國家和地區制定了不同的標准,由此產生了 GB2312、GBK、GB18030、Big5、Shift_JIS 等各自的編碼標准。這些使用多個字節來代表一個字符的各種漢字延伸編碼方式,稱為 ANSI 編碼。
在簡體中文Windows操作系統中,ANSI 編碼代表 GBK 編碼;
在繁體中文Windows操作系統中,ANSI編碼代表Big5;
在日文Windows操作系統中,ANSI 編碼代表 Shift_JIS 編碼。
不同 ANSI 編碼之間互不兼容,當信息在國際間交流時,無法將屬於兩種語言的文字,存儲在同一段 ANSI 編碼的文本中。
ANSI編碼表示英文字符時用一個字節,表示中文用兩個或四個字節。