1、計算機存儲信息的最小單位,稱之為位(bit),音譯為比特,二進制的一個“0”或一個“1”叫一位。
2、計算機存儲容量基本單位是字節(Byte),音譯為拜特,8個二進制位組成1個字節。一般而言:一個標准英文字母占一個字節位置,一個標准漢字占二個字節位置。
3、計算機存儲容量大小以字節數來度量,1024進位制:
1024B=1K(千)B
1024KB=1M(兆)B
1024MB=1G(吉)B
1024GB=1T(太)B
以下還有PB、EB、ZB、YB 、NB、DB,一般人不常使用了。
4、字符是一種符號,同以上說的存儲單位不是一回事。
=============================================================================
1個字節等於8個bit位,每個bit位又0/1兩種狀態,也就是說一個字節可以表示256個狀態,計算機里用字節來作為最基本的存儲單位。
一般來說,英文狀態下一個字母或數字(稱之為字符)占用一個字節,一個漢字用兩個字節表示。在不同的編碼方式下一個字符占的字節不太一樣。
按照ANSI編碼標准,標點符號、數字、大小寫字母都占一個字節,漢字占2個字節。按照UNICODE標准所有字符都占2個字節。
=============================================================================
(一)“字節”的定義
字節(Byte)是一種計量單位,表示數據量多少,它是計算機信息技術用於計量存儲容量的一種計量單位。
(二)“字符”的定義
字符是指計算機中使用的文字和符號,比如1、2、3、A、B、C、~!·#¥%……—*()——+、等等。
(三)“字節”與“字符”的區別
它們完全不是一個位面的概念,所以兩者之間沒有“區別”這個說法。
不同編碼里,字符和字節的對應關系不同:
①ASCII碼中:一個英文字母(不分大小寫)占一個字節的空間,一個中文漢字占兩個字節的空間。
一個二進制數字序列,在計算機中作為一個數字單元,一般為8位二進制數,換算為十進制。最小值0,最大值255。
②UTF-8編碼中:一個英文字符等於一個字節,一個中文(含繁體)等於三個字節。
③Unicode編碼中:一個英文字符等於兩個字節,一個中文(含繁體)等於兩個字節。
符號:英文標點占一個字節;中文標點占兩個字節。
舉例:英文句號“.”占1個字節的大小;中文句號“。”占2個字節的大小。
④UTF-16編碼中:一個英文字母字符或一個漢字字符存儲都需要2個字節(Unicode擴展區的一些漢字存儲需要4個字節)。
⑤UTF-32編碼中:世界上任何字符的存儲都需要4個字節。