非數值數據的編碼方式
1.邏輯值、字符等數據都是非數值數據,在機器內部他們也用二進制表示(因此n位二進制可表示n個邏輯值,運算是按位運算,例如“與”、“或”、“邏輯左移”、“邏輯右移”等)。
2.邏輯值:每個字或其他可尋址單位(字節、半字等)是作為一個整體數據單元看待的。(有些時候還需要將一個n位數據看成由n個1位數據組成,每個取值為0或1)。
3.邏輯數據和數值數據都是一串0/1序列,在形式上無任何差異,需要通過指令的操作碼類型來識別它們。(邏輯運算指令處理的是邏輯數據,算術運算指令處理的數值數據)。
非數值數據的類型
1.西文字符
1.西文由拉丁字母、數字、標點符號及一些特殊符號組成,它們統稱為字符。
2.字符主要用於外部設備和計算機之間交換信息(目前計算機中使用最廣泛的西文字符集及其編碼是ASCII碼!)。
7個二進位b6b5b4b3b2b1b0從0000000到1111111共表示128種編碼,可用來表示128個不同的字符,其中包括10個數字、26個小寫字母、26個大寫字母、算術運算符、標點符號、商業符號等
ASCII字符有兩個規律
(1)字符09這十個數字的高3位編碼為011,低4位分別為00001001。當去掉高3位時,低4位正好是0~9這10個數字的8421碼。
(2)英文字母字符的編碼值也滿足正常的字母排序關系,而且大、小寫字母的編碼之間有簡單的對應關系。
2.漢字字符
1.中文信息的基本組成單位是漢字,漢字也是字符。
2.漢字系統必須處理以下幾種漢字代碼:輸入碼、內碼、字模點陣碼。
3.漢字的輸入碼:利用英文鍵盤輸入漢字(漢字的輸入碼的碼元是西文鍵盤中的某個按鍵)。
4.字符集與漢字內碼必須考慮的因素:(1)不能有二義性,即不能和ASCII碼有相同的編碼。
(2)要與漢字在字庫中的位置有關系,以便於漢字的處理、查找。
(3)編碼應盡量短。
5.GB2312國標字符集由:第一部分字母、數字和各種符號;第二部分為一級常用漢字;第三部分為二級常用字。
6.漢字的區位碼並不是國標碼,每個漢字的區號和位號必須各自加上32,這樣區號和位號各自加上32后的相應二進制碼才是它的國標碼。
7.漢字的字形:字模點陣描述和輪廓描述。