
一、位:數據存儲的最小單位,每個二進制數字0或者1就是1個位。
二、字節
8個位構成一個字節;即:1 byte (字節)= 8 bit(位);
1 KB = 1024 B(字節);
1 MB = 1024 KB; (2^10 B)
1 GB = 1024 MB; (2^20 B)
1 TB = 1024 GB; (2^30 B)
三、字符
a、A、中、+、*、の均表示一個字符;
一般 utf-8 編碼下,一個漢字字符占用3個字節;
一般 gbk 編碼下,一個漢字字符占用2個字節;
四、字節和字符
字節是計算機傳輸數據的格式,供計算識別的,字符是供人類觀看的內容。
五、字符集:即各種各個字符的集合,也就是說哪些漢字,字母(A、b、c)和符號(空格、引號..)會被收入標准中。
六、編碼
規定每個“字符”分別用一個字節還是多個字節存儲,用哪些字節來存儲,這個規定就叫做“編碼”。(其實際是對字符集中字符進行編碼,即:每個字符用二進制在計算中表示存儲);
通俗的說:編碼就是按照規則對字符進行翻譯成對應的二進制數,在計算器中運行存儲,用戶看的時候(比如瀏覽器),在用對應的編碼解析出來用戶能看懂的;
七、編碼格式
字節和字符之間轉換,參照的規則就是編碼格式。如,Unicode編碼共有三種具體實現,分別為utf-8,utf-16,utf-32,其中utf-8占用一到四個字節,utf-16占用二或四個字節,utf-32占用四個字節。
