char和unsigned char --數據類型區別
除去布爾型和擴展的字符型之外,其它整型可以划分為帶符號的(signed)和無符號的(unsigned)兩種。
類型int、short、long和long long都是帶符號的,通過在這些類型名前添加unsigned就可以得到無符號類型。
與其它整型不同,字符型被分為了三種:char、singed char和unsigned char。需特別注意的是:類型char和類型signed char並不一樣。盡管字符型有三種,但字符的表現形式卻只有兩種:帶符號的和無符號的。類型char實際上會表現為上述兩種形式中的一種,具體是哪種是由編譯器決定。
首先在內存中,char與unsigned char沒有什么不同,都是一個字節,唯一的區別是,char的最高位為符號位,因此char能表示-128~127, unsigned char沒有符號位,因此能表示0~255,這個好理解,8個bit,最多256種情況,因此無論如何都能表示256個數字。所以在普通的賦值、讀寫文件和網絡字節流中都沒什么區別,反正就是一個字節,不管最高位是什么,最終的讀取結果都一樣,只是你怎么理解最高位而已,在屏幕上面的顯示可能不一樣。
但是我們卻發現在表示byte時,都用unsigned char,這是為什么呢?首先我們通常意義上理解,byte沒有什么符號位之說,更重要的是如果將byte的值賦給int,long等數據類型時,系統會做一些額外的工作。如果是char,那么系統認為最高位是符號位,而int可能是16或者32位,那么會對最高位進行擴展(注意,賦給unsigned int也會擴展)而如果是unsigned char,那么不會擴展。
測試代碼:
#include <stdio.h> void f(unsigned char v) { char c = v; unsigned char uc = v; unsigned int a = c, b = uc; int i = c, j = uc; printf("----------------\n"); printf("%%c: %c, %c\n", c, uc); printf("%%X: %X, %X\n", c, uc); printf("%%u: %u, %u\n", a, b); printf("%%d: %d, %d\n", i, j); } int main(int argc, char *argv[]) { f(0x80); f(0x7F); return 0; }
輸出:
%c: ?, ? %X: FFFFFF80, 80 %u: 4294967168, 128 %d: -128, 128 ---------------- %c: , %X: 7F, 7F %u: 127, 127 %d: 127, 127