1個漢字在UTF-8編碼占3個字節

本文轉載自查看原文 2016-10-30 10:22 2180

8. 實例

下面，舉一個實例。

打開"記事本"程序Notepad.exe，新建一個文本文件，內容就是一個"嚴"字，依次采用ANSI，Unicode，Unicode big endian 和 UTF-8編碼方式保存。

然后，用文本編輯軟件UltraEdit中的"十六進制功能"，觀察該文件的內部編碼方式。

1）ANSI：文件的編碼就是兩個字節"D1 CF"，這正是"嚴"的GB2312編碼，這也暗示GB2312是采用大頭方式存儲的。

2）Unicode：編碼是四個字節"FF FE 25 4E"，其中"FF FE"表明是小頭方式存儲，真正的編碼是4E25。

3）Unicode big endian：編碼是四個字節"FE FF 4E 25"，其中"FE FF"表明是大頭方式存儲。

4）UTF-8：編碼是六個字節"EF BB BF E4 B8 A5"，前三個字節"EF BB BF"表示這是UTF-8編碼，后三個"E4B8A5"就是"嚴"的具體編碼，它的存儲順序與編碼順序是一致的。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 UTF-8中文一個漢字占幾個字節？請問utf-8的中文是一個漢字占三個字節長度嗎？ utf-8 和 gbk 編碼下中英文分別占幾個字節在UTF-8中，一個漢字為什么需要三個字節？在UTF-8中，一個漢字為什么需要三個字節？（轉） python中一個漢字點3個字節？ utf-8 utf-8的中文，一個字符占幾個字節關於“為何Unicode中文字符占取2個字節，而 UTF-8卻占3個字節”的網絡解釋修正字符集之在UTF-8中，一個漢字為什么需要三個字節？ utf-8中的漢字占用多少字節