位(bit)、字節(byte)、字符、編碼之間的關系


 

 

 

一、位:數據存儲的最小單位,每個二進制數字0或者1就是1個位。

二、字節

    8個位構成一個字節;即:1 byte (字節)= 8 bit(位);

    1 KB = 1024 B(字節);

    1 MB = 1024 KB;   (2^10 B)

    1 GB = 1024 MB;  (2^20 B)

    1 TB = 1024 GB;   (2^30 B)

三、字符

    a、A、中、+、*、の均表示一個字符;

   一般 utf-8 編碼下,一個漢字字符占用3個字節;

   一般 gbk 編碼下,一個漢字字符占用2個字節;

四、字節和字符

    字節是計算機傳輸數據的格式,供計算識別的,字符是供人類觀看的內容。

五、字符集:即各種各個字符的集合,也就是說哪些漢字,字母(A、b、c)和符號(空格、引號..)會被收入標准中。

六、編碼

    規定每個“字符”分別用一個字節還是多個字節存儲,用哪些字節來存儲,這個規定就叫做“編碼”。(其實際是對字符集中字符進行編碼,即:每個字符用二進制在計算中表示存儲);

通俗的說:編碼就是按照規則對字符進行翻譯成對應的二進制數,在計算器中運行存儲,用戶看的時候(比如瀏覽器),在用對應的編碼解析出來用戶能看懂的;

七、編碼格式

    字節和字符之間轉換,參照的規則就是編碼格式。如,Unicode編碼共有三種具體實現,分別為utf-8,utf-16,utf-32,其中utf-8占用一到四個字節,utf-16占用二或四個字節,utf-32占用四個字節。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM