new與malloc的區別,以及內存分配淺析


 
從函數聲明上可以看出。malloc 和 new 至少有兩個不同: new 返回指定類型的 指針,並且可以自動計算所需要大小。比如:
1
2
3
int *p;
p = new int ;
//返回類型為int* 類型(整數型指針),分配大小為 sizeof(int);
或:
1
2
3
int * parr;
parr = new int [100];
//返回類型為 int* 類型(整數型指針),分配大小為 sizeof(int) * 100;
而 malloc 則必須要由我們計算字節數,並且在返回后強行轉換為實際類型的 指針
1
2
3
4
5
6
7
int * p;
p = ( int *) malloc ( sizeof ( int )*128);
//分配128個(可根據實際需要替換該數值)整型存儲單元,
//並將這128個連續的整型存儲單元的首地址存儲到指針變量p中
double *pd=( double *) malloc ( sizeof ( double )*12);
//分配12個double型存儲單元,
//並將首地址存儲到指針變量pd中
第一、malloc 函數返回的是 void * 類型。對於C++,如果你寫成:p = malloc (sizeof(int)); 則程序無法通過編譯,報錯:“不能將 void* 賦值給 int * 類型 變量”。所以必須通過 (int *) 來將 強制轉換。而對於C,沒有這個要求,但為了使C程序更方便的移植到C++中來,建議養成 強制轉換的習慣。
第二、函數的 實參為 sizeof(int) ,用於指明一個 整型數據需要的大小。如果你寫成:
1
int * p = ( int *) malloc (1);
代碼也能通過編譯,但事實上只分配了1個字節大小的內存空間,當你往里頭存入一個整數,就會有3個字節無家可歸,而直接“住進鄰居家”!造成的結果是后面的內存中原有數據內容被改寫。
 
下面一段話的原理講的比較清晰
malloc函數的實質體現在,它有一個將可用的內存塊連接為一個長長的列表的所謂空閑 鏈表。調用malloc函數時,它沿 連接表尋找一個大到足以滿足用戶請求所需要的內存塊。然后,將該內存塊一分為二(一塊的大小與用戶請求的大小相等,另一塊的大小就是剩下的字節)。接下來,將分配給用戶的那塊內存傳給用戶,並將剩下的那塊(如果有的話)返回到連接表上。調用 free函數時,它將用戶釋放的內存塊連接到空閑鏈上。到最后,空閑鏈會被切成很多的小內存片段,如果這時用戶申請一個大的內存片段,那么空閑鏈上可能沒有可以滿足用戶要求的片段了。於是,malloc函數請求延時,並開始在空閑鏈上翻箱倒櫃地檢查各內存片段,對它們進行整理,將相鄰的小空閑塊合並成較大的內存塊。如果無法獲得符合要求的內存塊,malloc函數會返回NULL 指針,因此在調用malloc動態申請內存塊時,一定要進行返回值的判斷。
 

二、malloc()到底從哪里得來了內存空間:

1、malloc()到底從哪里得到了內存空間?答案是從堆里面獲得空間。也就是說函數返回的指針是指向堆里面的一塊內存。操作系統中有一個記錄空閑內存地址的鏈表。當操作系統收到程序的申請時,就會遍歷該鏈表,然后就尋找第一個空間大於所申請空間的堆結點,然后就將該結點從空閑結點鏈表中刪除,並將該結點的空間分配給程序。就是這樣!

   說到這里,不得不另外插入一個小話題,相信大家也知道是什么話題了。什么是堆?說到堆,又忍不住說到了棧!什么是棧?下面就另外開個小部分專門而又簡單地說一下這個題外話:

2、什么是堆:堆是大家共有的空間,分全局堆和局部堆。全局堆就是所有沒有分配的空間,局部堆就是用戶分配的空間。堆在操作系統對進程 初始化的時候分配,運行過程中也可以向系統要額外的堆,但是記得用完了要還給操作系統,要不然就是內存泄漏。

   什么是棧:棧是線程獨有的,保存其運行狀態和局部自動變量的。棧在線程開始的時候初始化,每個線程的棧互相獨立。每個函數都有自己的棧,棧被用來在函數之間傳遞參數。操作系統在切換線程的時候會自動的切換棧,就是切換SS/ESP寄存器。棧空間不需要在高級語言里面顯式的分配和釋放。

   以上的概念描述是標准的描述,不過有個別語句被我刪除,不知道因為這樣而變得不標准了^_^.

   通過上面對概念的描述,可以知道:

   棧是由編譯器自動分配釋放,存放函數的參數值、局部變量的值等。操作方式類似於數據結構中的棧。

   堆一般由程序員分配釋放,若不釋放,程序結束時可能由OS回收。注意這里說是可能,並非一定。所以我想再強調一次,記得要釋放!

注意它與數據結構中的堆是兩回事,分配方式倒是類似於鏈表。(這點我上面稍微提過)

 

 所以,舉個例子,如果你在函數上面定義了一個指針變量,然后在這個函數里申請了一塊內存讓指針指向它。實際上,這個指針的地址是在棧上,但是它所指向的內容卻是在堆上面的!這一點要注意!所以,再想想,在一個函數里申請了空間后,比如說下面這個函數:

程序代碼:
   // code... 
       void Function(void) 
       { 
        char *p = (char *)malloc(100 * sizeof(char)); 
    }


  
   就這個例子,千萬不要認為函數返回,函數所在的棧被銷毀指針也跟着銷毀,申請的內存也就一樣跟着銷毀了!這絕對是錯誤的!因為申請的內存在堆上,而函數所在的棧被銷毀跟堆完全沒有啥關系。所以,還是那句話:記得釋放!

3、free()到底釋放了什么

   這個問題比較簡單,其實我是想和第二大部分的題目相呼應而已!哈哈!free()釋放的是指針指向的內存!注意!釋放的是內存,不是指針!這點非常非常重要!指針是一個變量,只有程序結束時才被銷毀。釋放了內存空間后,原來指向這塊空間的指針還是存在!只不過現在指針指向的內容的垃圾,是未定義的,所以說是垃圾。因此,前面我已經說過了,釋放內存后把指針指向NULL,防止指針在后面不小心又被解引用了。非常重要啊這一點!

   好了!這個“題外話”終於說完了。就這么簡單說一次,知道個大概就可以了!下面就進入第三個部分:

三、malloc()以及free()的機制:

   這個部分我今天才有了新的認識!而且是轉折性的認識!所以,這部分可能會有更多一些認識上的錯誤!不對的地方請大家幫忙指出!

   事實上,仔細看一下free()的函數原型,也許也會發現似乎很神奇,free()函數非常簡單,只有一個參數,只要把指向申請空間的指針傳遞

給free()中的參數就可以完成釋放工作!這里要追蹤到malloc()的申請問題了。申請的時候實際上占用的內存要比申請的大。因為超出的空間是用來記錄對這塊內存的管理信息。先看一下在《UNIX環境高級編程》中第七章的一段話:

   大多數實現所分配的存儲空間比所要求的要稍大一些,額外的空間用來記錄管理信息——分配塊的長度,指向下一個分配塊的指針等等。這就意味着如果寫過一個已分配區的尾端,則會改寫后一塊的管理信息。這種類型的錯誤是災難性的,但是因為這種錯誤不會很快就暴露出來,所以也就很難發現。將指向分配塊的指針向后移動也可能會改寫本塊的管理信息。

   以上這段話已經給了我們一些信息了。malloc()申請的空間實際我覺得就是分了兩個不同性質的空間。一個就是用來記錄管理信息的空間,另外一個就是可用空間了。而用來記錄管理信息的實際上是一個結構體。在C語言中,用結構體來記錄同一個對象的不同信息是

天經地義的事!下面看看這個結構體的原型:

程序代碼:
   struct mem_control_block { 
    int is_available;    //這是一個標記? 
    int size;            //這是實際空間的大小 
    };


  
   對於size,這個是實際空間大小。這里其實我有個疑問,is_available是否是一個標記?因為我看了free()的源代碼之后對這個變量感覺有點納悶(源代碼在下面分析)。這里還請大家指出!

   所以,free()就是根據這個結構體的信息來釋放malloc()申請的空間!而結構體的兩個成員的大小我想應該是操作系統的事了。但是這里有一個問題,malloc()申請空間后返回一個指針應該是指向第二種空間,也就是可用空間!不然,如果指向管理信息空間的話,寫入的內容和結構體的類型有可能不一致,或者會把管理信息屏蔽掉,那就沒法釋放內存空間了,所以會發生錯誤!(感覺自己這里說的是廢話)

   好了!下面看看free()的源代碼,我自己分析了一下,覺得比起malloc()的源代碼倒是容易簡單很多。只是有個疑問,下面指出!

程序代碼:
   // code... 
    
       void free(void *ptr)  
    { 
            struct mem_control_block *free; 
            free = ptr - sizeof(struct mem_control_block); 
            free->is_available = 1; 
            return; 
    }

   看一下函數第二句,這句非常重要和關鍵。其實這句就是把指向可用空間的指針倒回去,讓它指向管理信息的那塊空間,因為這里是在值上減去了一個結構體的大小!后面那一句free->is_available = 1;我有點納悶!我的想法是:這里is_available應該只是一個標記而已!因為從這個變量的名稱上來看,is_available 翻譯過來就是“是可以用”。不要說我土!我覺得變量名字可以反映一個變量的作用,特別是嚴謹的代碼。這是源代碼,所以我覺得絕對是嚴謹的!!這個變量的值是1,表明是可以用的空間!只是這里我想了想,如果把它改為0或者是其他值不知道會發生什么事?!但是有一點我可以肯定,就是釋放絕對不會那么順利進行!因為這是一個標記!

   當然,這里可能還是有人會有疑問,為什么這樣就可以釋放呢??我剛才也有這個疑問。后來我想到,釋放是操作系統的事,那么就free()這個源代碼來看,什么也沒有釋放,對吧?但是它確實是確定了管理信息的那塊內存的內容。所以,free()只是記錄了一些信息,然后告訴操作系統那塊內存可以去釋放,具體怎么告訴操作系統的我不清楚,但我覺得這個已經超出了我這篇文章的討論范圍了。

   那么,我之前有個錯誤的認識,就是認為指向那塊內存的指針不管移到那塊內存中的哪個位置都可以釋放那塊內存!但是,這是大錯特錯!釋放是不可以釋放一部分的!首先這點應該要明白。而且,從free()的源代碼看,ptr只能指向可用空間的首地址,不然,減去結構體大小之后一定不是指向管理信息空間的首地址。所以,要確保指針指向可用空間的首地址!不信嗎?自己可以寫一個程序然后移動指向可用空間的指針,看程序會有會崩!

   最后可能想到malloc()的源代碼看看malloc()到底是怎么分配空間的,這里面涉及到很多其他方面的知識!有興趣的朋友可以自己去下載源
代碼去看看。

//部分轉載自http://www.bccn.net/Article/kfyy/cyy/jszl/200608/4238_2.html 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM