擴展字符集UTF-8


ASCII
    ASCII編碼格式每個字符占一個字節。一個字節共有8位二進制字符,但在ASCII中只有后面的7個字節通過變化來表示字符,第一位是不變的,永遠是‘0’。后面的7位最多有128種變換,所以ASCII只能表示128個字符。

 

128個字符並不夠用,所以有了擴展字符集

 

UTF-8
 utf-8編碼就是ASCII的擴展字符集。
 utf-8的長度是可變的,如果存儲的字符用ASCII編碼就可保存的話,utf-8就會用ASCII編碼儲存這個字符,這樣這個字符就只占一個字節。
 當出現ASCII編碼表示不了的字符時就使用多位的方式保存,如下圖所示,在第一個字節的前幾位表示當前字符的長度,幾個‘1’就代表占幾個字節。比如第三行那個,程序讀取到第一個字節,看到前面有3個‘1’,程序在讀取時在向后尋找2兩個字節湊夠3個字節,在將圖中的‘x’位拼到一起讀取,就得到了一個完整的字符。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM