一、編碼的由來
計算機只能計算和識別二進制,必須讓計算機識別文字,才能和計算機進行交互,彼此也才能通過計算機通信。
由此,有了ASCII編碼的誕生,它起始於50年代后期,在1967年定案,是最初美國國家標准,供不同計算機在相互通信時用作共同遵守的西文字符編碼標准。
二、ASCII編碼
八位二進制最多可以表示的十進制數字范圍是,0000 0000 ~ 1111 1111 = 0 ~ 255 ,一共256個不同數字。
ASCII編碼就是將常用的英文字符和符號,與256個數字逐一對應起來形成的對應表。
由於計算機是美國人發明的,因此,最早只有127個字母被編碼到計算機里,也就是大小寫英文字母、數字和一些符號,這個編碼表被稱為ASCII編碼;
后來又擴展了128個,稱為擴展ASCII碼。
例如:十進制33對應嘆號!,65對應大寫A,83對應大寫S,97對應小寫a
這樣我們輸入字符,計算機轉換成十進制,再轉換成二進制,就可以通過計算機計算或傳輸。
三、字節
中英文都需要斷句才能明確含義,二進制也一樣。
一串二進制數字,沒有規定開頭結尾,是無法准確識別轉換成十進制,從而對應編碼找出對應字符的。
ASCII編碼一共256個,0~255,最多八位二進制就能表示完全,所以規定八位二進制為一個單位,不足前面補0;
例如:大寫A對應十進制65,計算機里就是0100 0001,這樣一串二進制就能八位一讀寫,准確識別。
在這里,每一位0或者1所占的空間單位為bit(比特),這是計算機中最小的表示單位;
每8個bit組成一個字節,這是計算機中最小的存儲單位(畢竟你是沒有辦法存儲半個字符的)
bit 位,計算機中最小的表示單位 8bit = 1bytes 字節,最小的存儲單位,1bytes縮寫為1B 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB 1PB=1024TB 1EB=1024PB 1ZB=1024EB 1YB=1024ZB 1BB=1024YB