C語言中的正負數及其輸出


在數學中,數字有正負之分。在C語言中也是一樣,short、int、long 都可以帶上正負號,例如:

//負數
short a1 = -10;
short a2 = -0x2dc9;  //十六進制
//正數
int b1 = +10;
int b2 = +0174;  //八進制
int b3 = 22910;
//負數和正數相加
long c = (-9) + (+12);

如果不帶正負號,默認就是正數。

符號也是數字的一部分,也要在內存中體現出來。符號只有正負兩種情況,用1位(Bit)就足以表示;C語言規定,把內存的最高位作為符號位。以 int 為例,它占用 32 位的內存,0~30 位表示數值,31 位表示正負號。如下圖所示:


在編程語言中,計數往往是從0開始,例如字符串 "abc123",我們稱第 0 個字符是 a,第 1 個字符是 b,第 5 個字符是 3。這和我們平時從 1 開始計數的習慣不一樣,大家要慢慢適應,培養編程思維。

C語言規定,在符號位中,用 0 表示正數,用 1 表示負數。例如 int 類型的 -10 和 +16 在內存中的表示如下:


short、int 和 long 類型默認都是帶符號位的,符號位以外的內存才是數值位。如果只考慮正數,那么各種類型能表示的數值范圍(取值范圍)就比原來小了一半。

但是在很多情況下,我們非常確定某個數字只能是正數,比如班級學生的人數、字符串的長度、內存地址等,這個時候符號位就是多余的了,就不如刪掉符號位,把所有的位都用來存儲數值,這樣能表示的數值范圍更大(大一倍)。

C語言允許我們這樣做,如果不希望設置符號位,可以在數據類型前面加上 unsigned 關鍵字,例如:

unsigned short a = 12;
unsigned int b = 1002;
unsigned long c = 9892320;

這樣,short、int、long 中就沒有符號位了,所有的位都用來表示數值,正數的取值范圍更大了。這也意味着,使用了 unsigned 后只能表示正數,不能再表示負數了。

如果將一個數字分為符號和數值兩部分,那么不加 unsigned 的數字稱為有符號數,能表示正數和負數,加了 unsigned 的數字稱為無符號數,只能表示正數。

請讀者注意一個小細節,如果是unsigned int類型,那么可以省略 int ,只寫 unsigned,例如:

unsigned n = 100;

它等價於:

unsigned int n = 100;

無符號數的輸出

無符號數可以以八進制、十進制和十六進制的形式輸出,它們對應的格式控制符分別為:

  unsigned short unsigned int unsigned long
八進制 %ho %o %lo
十進制 %hu %u %lu
十六進制 %hx 或者 %hX %x 或者 %X %lx 或者 %lX


上節我們也講到了不同進制形式的輸出,但是上節我們還沒有講到正負數,所以也沒有關心這一點,只是“籠統”地介紹了一遍。現在本節已經講到了正負數,那我們就再深入地說一下。

嚴格來說,格式控制符和整數的符號是緊密相關的,具體就是:

  • %d 以十進制形式輸出有符號數;
  • %u 以十進制形式輸出無符號數;
  • %o 以八進制形式輸出無符號數;
  • %x 以十六進制形式輸出無符號數。


那么,如何以八進制和十六進制形式輸出有符號數呢?很遺憾,printf 並不支持,也沒有對應的格式控制符。在實際開發中,也基本沒有“輸出負的八進制數或者十六進制數”這樣的需求,我想可能正是因為這一點,printf 才沒有提供對應的格式控制符。

下表全面地總結了不同類型的整數,以不同進制的形式輸出時對應的格式控制符(--表示沒有對應的格式控制符)。

  short int long unsigned short unsigned int unsigned long
八進制 -- -- -- %ho %o %lo
十進制 %hd %d %ld %hu %u %lu
十六進制 -- -- -- %hx 或者 %hX %x 或者 %X %lx 或者 %lX


有讀者可能會問,上節我們也使用 %o 和 %x 來輸出有符號數了,為什么沒有發生錯誤呢?這是因為:

  • 當以有符號數的形式輸出時,printf 會讀取數字所占用的內存,並把最高位作為符號位,把剩下的內存作為數值位;
  • 當以無符號數的形式輸出時,printf 也會讀取數字所占用的內存,並把所有的內存都作為數值位對待。


對於一個有符號的正數,它的符號位是 0,當按照無符號數的形式讀取時,符號位就變成了數值位,但是該位恰好是 0 而不是 1,所以對數值不會產生影響,這就好比在一個數字前面加 0,有多少個 0 都不會影響數字的值。

如果對一個有符號的負數使用 %o 或者 %x 輸出,那么結果就會大相徑庭,讀者可以親試。

可以說,“有符號正數的最高位是 0”這個巧合才使得 %o 和 %x 輸出有符號數時不會出錯。

再次強調,不管是以 %o、%u、%x 輸出有符號數,還是以 %d 輸出無符號數,編譯器都不會報錯,只是對內存的解釋不同了。%o、%d、%u、%x 這些格式控制符不會關心數字在定義時到底是有符號的還是無符號的:

  • 你讓我輸出無符號數,那我在讀取內存時就不區分符號位和數值位了,我會把所有的內存都看做數值位;
  • 你讓我輸出有符號數,那我在讀取內存時會把最高位作為符號位,把剩下的內存作為數值位。


說得再直接一些,我管你在定義時是有符號數還是無符號數呢,我只關心內存,有符號數也可以按照無符號數輸出,無符號數也可以按照有符號數輸出,至於輸出結果對不對,那我就不管了,你自己承擔風險。

下面的代碼進行了全面的演示:

  1. #include <stdio.h>
  2. int main()
  3. {
  4. short a = 0100; //八進制
  5. int b = -0x1; //十六進制
  6. long c = 720; //十進制
  7. unsigned short m = 0xffff; //十六進制
  8. unsigned int n = 0x80000000; //十六進制
  9. unsigned long p = 100; //十進制
  10. //以無符號的形式輸出有符號數
  11. printf("a=%#ho, b=%#x, c=%ld\n", a, b, c);
  12. //以有符號數的形式輸出無符號類型(只能以十進制形式輸出)
  13. printf("m=%hd, n=%d, p=%ld\n", m, n, p);
  14. return 0;
  15. }

運行結果:
a=0100, b=0xffffffff, c=720
m=-1, n=-2147483648, p=100

對於絕大多數初學者來說,b、m、n 的輸出結果看起來非常奇怪,甚至不能理解。按照一般的推理,b、m、n 這三個整數在內存中的存儲形式分別是:

當以 %x 輸出 b 時,結果應該是 0x80000001;當以 %hd、%d 輸出 m、n 時,結果應該分別是 -7fff、-0。但是實際的輸出結果和我們推理的結果卻大相徑庭,這是為什么呢?

注意,-7fff 是十六進制形式。%d 本來應該輸出十進制,這里只是為了看起來方便,才改為十六進制。

其實這跟整數在內存中的存儲形式以及讀取方式有關。b 是一個有符號的負數,它在內存中並不是像上圖演示的那樣存儲,而是要經過一定的轉換才能寫入內存;m、n 的內存雖然沒有錯誤,但是當以 %d 輸出時,並不是原樣輸出,而是有一個逆向的轉換過程(和存儲時的轉換過程恰好相反)。

也就是說,整數在寫入內存之前可能會發生轉換,在讀取時也可能會發生轉換,而我們沒有考慮這種轉換,所以才會導致推理錯誤。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM