1. 位(bit)
- 又名“比特”
- 數據存儲的最小單位
- 每個二進制數字
0
或1
就是 1 個位 - 縮寫可用小
b
表示
2. 字節(byte)
-
8 個位構成 1 個字節,即:
1 byte = 8 bit
。 -
縮寫可用大
B
表示;
// 二進制值(另“國際標准單位值”時進制是1000)
1 B = 8 b;
1 KB = 1024 B; (2^10 B)
1 MB = 1024 KB = 1048576 B; (2^20 B)
1 GB = 1024 MB = 1024*1024 KB = 1024^3 B; (2^30 B)
1 TB = 1024 GB = 1024*1024 MB = 1024^3 KB = 1024^4 B; (2^40 B)
3. 字符
字符是一個信息單位,在計算機里面,一個中文漢字是一個字符,一個英文字母是一個字符,一個阿拉伯數字是一個字符,一個標點符號也是一個字符。如:a、A、中、1、100、+、*、の......等等。
4. 字符集
字符集是字符組成的集合,通常以二維表的形式存在,二維表的內容和大小是由使用者的語言而定,是英語,是漢語,還是阿拉伯語。
5. 字符編碼
字符編碼是把字符集中的字符編碼為特定的二進制數,以便在計算機中存儲。編碼方式一般就是對二維表的橫縱坐標進行變換的算法。一般都比較簡單,直接把橫縱坐標拼一起就完事了。后來隨着字符集的不斷擴大,為了節省存儲空間,才出現了各種各樣的算法。
字符集和字符編碼一般都是成對出現的,如ASCII、IOS-8859-1、GB2312、GBK,都是既表示了字符集又表示了對應的字符編碼,以后統稱為編碼。
注意:MiB 和 MB,KiB 和 KB 等的區別:
1KB(kilobyte) = 1000 byte, 1KiB(kibibyte) = 1024 byte
1MB(megabyte) = 1000000 byte, 1MiB(mebibyte) = 1048576 byte
硬盤 生產商是以 GB(十進制,即 10 的 3 次方=1000,如 1MB=1000KB)計算的,而電腦(操作系統)是以 GiB(2 進制,即 2 的 10 次方,如 1MiB=1024KiB)計算的,但用戶一般理解為 1MB = 1024KB, 所以為了便於中文化的理解,翻譯 MiB 為 MB 也是可以的。
同樣根據硬盤廠商與用戶對於 1MB 大小的不同理解,所以好多 160G 的硬盤實際容量按計算機實際的 1MB = 1024KB 算都不到 160G,這也可以解釋為什么新買的硬盤“缺斤短兩”並沒有它所標示的那么大。
寬帶 網絡中,運營商們所說的 1M 帶寬是指 1Mbps(megabits per second,兆比特每秒)。bps 是 bit per Second 的縮寫,也就是每秒多少“位”(bit)的意思。是用來計算資料傳輸速率的單“位”。舉例來說,電信局通常說的 1M 的寬,所使用的單位就是 bps,我們都知道一個字節等於 8 位,而我們電腦的存儲單位使用的是字節,也就是理論上每秒可以向硬盤下載 1X1024/8=128KB/sec 的數據。但這也只是理論上的速度。實際上則要再扣約 12%的數據頭信息(包 Ethernet Header,IP Header,TCP Header,ATM Header 等),各種各樣的控制訊號。所以傳輸速度上限應 112KB/sec 左右,而不應該望文生義地理解為“每秒鍾可以傳送 1M 字節的數據。所以千萬不要迷信廣告,傳輸單位的寫法上,B 和 b 分別代表 Bytes 和 bits,兩者定義不同,差距是 8 倍。
英文字母和中文漢字在不同字符集編碼下的字節數
編碼 | 字節數(英文) | 字節數(中文) |
---|---|---|
GB2312 | 1 | 2 |
GBK | 1 | 2 |
GB18030 | 1 | 2 |
ISO-8859-1 | 1 | 1 |
UTF-8 | 1 | 3 |
UTF-16 | 4 | 4 |
UTF-16BE | 2 | 2 |
UTF-16LE | 2 | 2 |