在前面一節中簡單介紹了變量的使用,當我們定義一個變量的時候,系統就會為變量分配一塊存儲空間。而變量的數值在內存中是以二進制的形式存儲的,這講來深入研究變量在內存中的一些存儲細節。
一、字節和地址
為了更好地理解變量在內存中的存儲細節,先來認識一下內存中的“字節”和“地址”。
1.計算機中的內存是以字節為單位的存儲空間。內存的每一個字節都有一個唯一的編號,這個編號就稱為地址。就好像酒店是以房間為單位的,每個房間都有一個唯一的房號,我們根據房號就能找到對應的房間。

里面的每個小框框就代表着內存中的一個字節,白色數字就是每個字節的地址(這里采取十六進制來顯示,地址值是隨便寫的,僅作為參考,真實情況中的地址值不一定是這個),可以發現,內存中相鄰字節的地址是連續的。
2.大家都知道,一個字節有8位,所能表示的數據范圍是非常有限的,因此,范圍較大的數據就要占用多個字節,也就是說,不同類型的數據所占用的字節數是不一樣的。
二、變量的存儲
1.變量類型的作用
跟其他編程語言一樣,C語言中用變量來存儲計算過程使用的值,任何變量都必須先定義類型再使用。為什么一定要先定義呢?因為變量的類型決定了變量占用的存儲空間,所以定義變量類型,就是為了給該變量分配適當的存儲空間,以便存放數據。比如char類型,它是用來存儲一個字符的,一個字符的話只需要1個字節的存儲空間, 因此系統就只會給char類型變量分配1個字節,沒必要分配2個字節、3個字節乃至更多的存儲空間。
2.變量占用多少存儲空間
1> 一個變量所占用的存儲空間,不僅跟變量類型有關,而且還跟平台有關系。同一種類型的變量,在不同平台下所占用的存儲空間又是不一樣的。我們都知道操作系統是有不同位數的,比如Win7有分32位、64位。由於我們是Mac 64位系統下開發,就以64位為標准。
2> 下面的表格描述了在64位環境下,基本數據類型所占用的存儲空間,了解這些細節,對以后學習指針和數組時是很有幫助的。

3.變量示例
當定義一個變量時,系統就會為這個變量分配一定的存儲空間。
1 int main() 2 { 3 char a = 'A'; 4 5 int b = 10; 6 7 return 0; 8 }
1> 在64bit環境下,系統為變量a、b分別分配1個字節、4個字節的存儲單元。也就是說:
- 變量b中的10是用4個字節來存儲的,4個字節共32位,因此變量b在內存中的存儲形式應該是0000 0000 0000 0000 0000 0000 0000 1010。
- 變量a中的'A'是用1個字節來存儲的,1個字節共8位,變量a在內存中的存儲形式是0100 0001,至於為什么'A'的二進制是這樣呢,后面再討論。
2> 上述變量a、b在內存中的存儲情況大致如下表所示:

(注:"存儲的內容"那一列的一個小格子就代表一個字節,"地址"那一列是指每個字節的地址)
- 從圖中可以看出,變量b占用了內存地址從ffc1~ffc4的4個字節,變量a占用了內存地址為ffc5的1個字節。每個字節都有自己的地址,其實變量也有地址。變量存儲單元的第一個字節的地址就是該變量的地址。變量a的地址是ffc5,變量b的地址是ffc1。
- 內存尋址是從大到小的,也就是說做什么事都會先從內存地址較大的字節開始,因此系統會優先分配地址值較大的字節給變量。由於是先定義變量a、后定義變量b,因此你會看到變量a的地址ffc5比變量b的地址ffc1大。
- 注意看表格中變量b存儲的內容,變量b的二進制形式是:0000 0000 0000 0000 0000 0000 0000 1010。由於內存尋址是從大到小的,所以是從內存地址最大的字節開始存儲數據,存放順序是ffc4 -> ffc3 -> ffc2 -> ffc1,所以把前面的0000 0000都放在ffc2~ffc4中,最后面的八位0000 1010放在ffc1中。
4.查看變量的內存地址
在調試過程中,我們經常會采取打印的方式查看變量的地址
1 #include <stdio.h> 2 3 int main() 4 { 5 int a = 10; 6 printf("變量a的地址是:%p", &a); 7 return 0; 8 }
第6行中的&是一個地址運算符,&a表示取得變量a的地址。格式符%p是專門用來輸出地址的。輸出結果是:
變量a的地址是:0x7fff5fbff8f8
這個0x7fff5fbff8f8就是變量a的內存地址
三、負數的二進制形式
1 int main() 2 { 3 int b = -10; 4 return 0; 5 }
在第3行定義了一個整型變量,它的值是-10。-10在內存中怎樣存儲的呢?其實任何數值在內存中都是以補碼的形式存儲的。
- 正數的補碼與原碼相同。比如9的原碼和補碼都是1001
- 負數的補碼等於它正數的原碼取反后再+1。(取反的意思就是0變1、1變0)
那么-10的補碼計算過程如下:
1> 先算出10的二進制形式:0000 0000 0000 0000 0000 0000 0000 1010
2> 對10的二進制進行取反:1111 1111 1111 1111 1111 1111 1111 0101
3> 對取反后的結果+1:1111 1111 1111 1111 1111 1111 1111 0110
因此,整數-10在內存中的二進制形式是:1111 1111 1111 1111 1111 1111 1111 0110

四、變量的作用域
1.作用域簡介
變量的作用域就是指變量的作用范圍。先來看看下面的程序:
1 int main() 2 { 3 int a = 7; 4 5 return 0; 6 }
- 在第3行定義了一個變量a,當執行到這行代碼時,系統就會為變量a分配存儲空間
- 當main函數執行完畢,也就是執行完第5行代碼了,變量a所占用的內存就會被系統自動回收
- 因此,變量a的作用范圍是從定義它的那行開始,一直到它所在的大括號{}結束,也就是第3~6行,一旦離開這個范圍,變量a就失效了
2.代碼塊
1> 代碼塊其實就是用大括號{}括住的一塊代碼。
1 int main() 2 { 3 { 4 int a = 10; 5 6 printf("a=%d", a); 7 } 8 9 a = 9; 10 11 return 0; 12 }
- 注意第3~7行的大括號,這就是一個代碼塊
- 當執行到第4行時,系統會分配內存給變量a
- 當代碼塊執行完畢,也就是執行完第6行代碼后,變量a所占用的內存就會被系統回收
- 因此,變量a的作用范圍是從定義它的那行開始,一直到它所在的大括號{}結束,也就是第4~7行,離開這個范圍,變量a就失效了
- 所以,上面的程序是編譯失敗的,第9行代碼是錯誤的,變量a在第7行的時候已經失效了,不可能在第9行使用
2> 如果是下面這種情況
1 int main() 2 { 3 int a = 9; 4 5 { 6 int a = 10; 7 8 printf("a=%d", a); 9 } 10 11 return 0; 12 }
- 注意第3、6行,各自定義了一個變量a,這種情況是沒問題的。C語言規定:在不同作用域中允許有同名變量,系統會為它們分配不同的存儲空間。
- 在第3行定義的變量a的作用域是:第3~12行;在第6行定義的變量a的作用域是:第6~9行。
- 最后注意第8行:嘗試輸出變量a的值。那這里輸出的是哪一個變量a呢?先看輸出結果:
a=10
這里采取的是“就近原則”,也就是第8行訪問的是在第6行定義的變量a,並不是在第3行的變量a。
五、變量的初始化
變量在沒有進行初始化之前,不要拿來使用,因為它里面存儲的是一些垃圾數據
1 #include <stdio.h> 2 3 int main() 4 { 5 int c; 6 7 printf("%d", c); 8 return 0; 9 }
注意第5行的變量c,只是定義了變量,並沒有給它賦初值。輸出結果:
1606422622
可以發現,變量c里面存儲的是一些亂七八糟的數據
