漫談 C++ 的內存堆實現原理

本文轉載自查看原文 2018-08-24 01:56 1465

如果我來設計 C++ 的內存堆，我會這樣設計：

進程首先會跟操作系統要一塊大內存區域，我稱之為 Division ，簡稱 div 。

然后，將這塊 div 作為堆，就可以開始從堆里分配內存了。

堆里未分配可使用的內存區域稱之為 Free Space ，一開始的時候， div 里只有一個 Free Space ，就是整個 div 。

如果只分配不回收的話， div 里永遠都只有一個 Free Space 。隨着分配和回收， div 里會產生多個 Free Space 。

我們需要建立一張堆表來記錄 Free Space ，這樣才能知道每一次分配應該到哪個 Free Space 里分配。

堆表應該是一個鏈表，便於插入和刪除表項。表項就是 Free Space ，或者說表項描述 Free Space 。所以表項會包含 2 個字段，一個是 Free Space 的起始地址，另一個是 Free Space 的結束地址。

同時還應該有一個指針，指向當前在用的表項，一次分配就是在當前表項指向的 Free Space 里分配，如果當前 Free Space 的大小不足以分配本次申請的內存塊大小，則將指針指向當前 Free Space 的下一個 Free Space 。如果下一個 Free Space 的大小也不夠，那么就繼續指向下一個 Free Space 。如此循環。

那如果最后一個 Free Space 的大小也不夠的話，就需要向操作系統要一個新的 div 。注意， Free Space 只能屬於一個 div ，不能跨 div 。

如果堆里的 Free Space 比較多，那么如果 Free Space 大小不夠，有可能會連續找多個 Free Space 才找到足夠大小的 Free Space ，這里就產生了一個性能問題。

最壞的情況， “從頭找到尾” ，到最后一個 Free Space 才足夠大小。但，這還不是最壞的 ^^ ，如果最后一個 Free Space 的大小也不夠的話，就要跟操作系統要一個新的 div ，這好像要 “更壞” 一點。 ^^

還有一個重要的問題需要考慮，就是如果跟操作系統要了 1 個以上的 div ，如果長期占用，這是一個不小的空間。那么，要怎樣在 div 中的內存全部都已經回收（整個 div 是一個 Free Space）的時候，將 div 歸還操作系統呢？

可以通過一個計數器。可以為每個 div 設置一個計數器，同時在堆表項里增加一個字段： Free Space 所在的 div 。

這樣，每次分配的時候就在計數器里加 1 ，每次回收就讓計數器減 1 ，如果減 1 以后計數器的值是 0 ，那么就說明 div 已經全部回收，可以將 div 歸還操作系統。

最后，我很好奇， C++ 是怎么解決內存碎片的問題的。哈哈哈哈

突然發現堆的管理算法有點小復雜，如果堆表本身占用的內存空間是固定的，那么如果 Free Space 的數量超出了對表的空間所能存儲的數量，這就有問題，如果舍棄一些比較小的 Free Space ，會造成內存泄露。

如果堆表的存儲空間也是通過堆的方式來分配，那么，當應用程序申請了一塊內存，此時產生了一個新的 Free Space ，為了記錄這個 Free Space ，需要為描述這個 Free Space 的堆表項也申請一塊內存，這樣 Free Space 又會發生變化，可能產生 1 個新的 Free Space，或者要記錄的這個 Free Space 發生變化，需要把這些情況也考慮進去。

還有一種情況是歸還內存塊的時候，這個內存塊剛好在 2 個 Free Space 中間，那么歸還這個內存塊就不是簡單的在堆表里添加一個堆表項，而是要和前后 2 個 FreeSpace “合並” 起來。這 3 個 Free Space 會合並成 1 個 Free Space ，在堆表里會刪除原來的 2 個 Free Space 表項，同時在這 2 個表項的位置添加入合並后的新表項。

問題是，要怎么知道歸還的內存塊在某 2 個 Free Space 中間？好像只能遍歷。但這意味着每次歸還的時候都要遍歷。

然后。

實際上，不僅僅內存塊在 2 個 Free Space 之間會存在這個問題，只要歸還的內存塊的任一邊（前或后）和 1 個 Free Space 相連，都需要 “合並” 。

如果要快速的找到和自己鄰近的 Free Space ，可能需要建立索引。可以建立不止一個的索引。

比如可以按起始位置建立索引，同時還可以按 Free Space 的大小建立索引。前者可以快速的尋找和當前歸還的內存塊相鄰的 Free Space 。后者可以快速的尋找接近指定大小的 Free Space ，這可以用在分配的時候，尋找接近申請內存塊大小的 Free Space 進行分配有利於提高內存利用率，減少碎片。

索引也可以排序，如果要優先從小的 Free Space 或者大的 Free Space 來分配的話，索引的排序作用也可以派上用場。

關於索引，我在《我發起了一個 .Net 開源數據庫項目 SqlNet》 https://www.cnblogs.com/KSongKing/p/9501739.html 中有一些論述。實際上，我正是考慮數據庫中 Data Block 的 Free Space 如何管理，所以才繼續思考內存堆的管理問題，然后就產生了上面的一些思考結果。

可以設想一下具體的做法：

如果不考慮堆的無限增長的話，設計起來並不太難：）所謂無限增長，主要是指堆表的無限增長。堆表為什么會無限增長呢？堆表是保存 Free Space 的，如果 Free Space 無限增長，那么堆表就會無限增長。 Free Space 的數量是不確定的，但理論上，似乎不能給出一個限制。如果我們給定堆表的長度是 1萬，那么就只能記錄 1萬個 Free Space ，超出 1萬個的 Free Space 會因為不能記錄而處於 “遺棄” 的狀態，既不能分配也不能回收。這就造成了內存泄漏。

如果在堆表達到上限的時候拋出異常 “堆表超出最大范圍” ，就像 StackOverflow 或者 OutOfMemory ，但這可能會限制了應用程序的能力。

如果按照上文的說法，堆表的存儲本身也完全通過堆分配進行，這樣可以很靈活，看起來只要內存空間足夠，那么，堆表可以無限增長。

但這種做法是 “自己描述自己” 的一個循環，會導致算法復雜，循環，或者無解。所以我們放棄了這種方式。

問題出在哪里呢？堆表項自身對於內存空間的占用不能計算到堆的分配里。堆表應該是單獨占用一塊空間，堆表項及索引項的添加刪除在這個空間也會造成空閑空間（Free Space），但這些 Free Space 不能計算到堆里，而應該是獨立於堆的存在。否則就會陷入上述的 “自己描述自己” 的循環。總之情況很復雜，可能無解。當然也許有解，但我不想繼續思考下去了：）

所以，回到開始，如果不考慮堆的無限增長的話，就是說給定一個堆表的固定大小，我們這樣來設計堆試試看。經過上面的論述，實際上，如果要設計無限增長的堆表，那么，在固定大小的堆表基礎上，增加一點：當當前堆表空間不夠時，再申請一塊堆表空間用於繼續存放堆表，這樣堆表就能繼續增長了。

我們提供一塊連續的內存空間來存儲堆表，這塊內存空間我們稱之為堆表空間。按照上面說的，我們先嘗試實現一個固定大小的堆表空間的堆。

堆表的內容包括 Free Space 項和索引。索引由索引項組成，索引項最終會指向堆表項， Free Space 項之間通過鏈表的方式相連。 Free Space 項和索引項都存儲在堆表空間里。

堆表還包括一個指針，指向堆表的最后一個元素的結束地址的下一個地址，我們將這個指針稱為 “Append 指針” 。

所有新建的堆表項（Free Space 項和索引項）都添加至 Append 指針指示的地址，每添加完一個堆表項， Append 指針會指向這個堆表項的結束地址的下一個地址。當 Append 指針指向的地址到堆表的結束地址之間的空間不夠存放新的堆表項時，會檢查 “堆表空閑空間計數器” ， —— 等 —— 什么是 “堆表空閑空間計數器” ？在堆表的使用過程中，隨着 Free Space 項和索引項的添加刪除，當然也會出現 “空閑空間” ，我們會用一個整數變量，來記錄空閑空間有多少（以 Byte 為單位），每次刪除堆表項（Free Space 項和索引項）的時候，會將回收的空閑空間累計到這個整數變量里。這個變量就是 “堆表空閑空間計數器” 。注意， “堆表空閑空間計數器” 記錄的是 Append 指針指向的地址之前 “已使用的空間” 中因堆表項的刪除而 “空出來” 的空閑空間。這些空閑空間平時不會去動它，只有上面說的 “當 Append 指針指向的地址到堆表的結束地址之間的空間不夠存放新的堆表項時” ，才會去關心它。怎么關心呢？這個時候，會做一次 “垃圾回收” ，就是把這些空閑空間后面的數據向前移動，填補這些空閑空間，就可以了。當然，會先檢查 “堆表空閑空間計數器” ，如果計數器值為 0 ，表明沒有空閑空間，不需要垃圾回收，大於 0 表示有空閑空間，需要垃圾回收。如果沒有要回收的空閑空間，或者回收了空閑空間以后 Append 指針指向的地址到堆表的結束地址之間的空間仍然不夠存放新的堆表項，怎么辦呢？對於固定大小的堆表，則拋出異常 “堆表超出最大范圍” ，就像 StackOverflow 或者 OutOfMemory 。對於可以無限增長的堆表，則新申請一塊堆表空間，繼續工作。新的堆表空間和原來的堆表空間之間通過鏈表的方式相連。

一個堆表空間包括 3 個部分組成：

1 一塊連續的內存空間

2 Append 指針

3 堆表空閑空間計數器

要申請新的堆表空間，需要提前進行，不要等到空間不夠用的時候再進行。這是因為新的堆表空間的申請同樣也是通過堆的方式進行，同樣需要在堆表里記錄堆表項（Free Space 項和索引項）。當某一次申請或回收需要記錄堆表項（Free Space 項和索引項）而空間不夠時再去申請新的堆表空間，則本次應用程序的申請或者回收所產生的堆表項（Free Space 項和索引項）和申請新的堆表空間所產生的堆表項（Free Space 項和索引項）要放在一起計算和存儲，這樣情況很復雜。

所以，應用程序的申請和回收內存塊，和申請新的堆表空間，應該是 2 次獨立操作。所以需要提前進行 “未雨綢繆” 。提前到什么程度呢？在原來的堆表空間的剩余空間還足夠存儲一次申請內存塊產生的可能的最大數量的堆表項（Free Space 項和索引項）的時候。

申請一次內存塊可能產生多少堆表項（Free Space 項和索引項）？ Free Space 項容易理解，上文也分析過。那么會產生多少索引項？

上文中提到可以創建 2 個索引： 1 Free Space 起始地址作為檢索條件的索引， 2 Free Space Size（空間大小）作為檢索條件的索引。

索引 1 可以用做回收時查詢和回收的內存塊相鄰的 Free Space ，如果 2 者是相接的，則會進行合並。

索引 2 可以用做分配時查找 Size（空間大小）最接近申請內存塊大小的 Free Space 。

但實際上，索引的創建也是比較消耗時間的，分配可以采用前文最早提出的先在當前 Free Space 中分配，若當前 Free Space 的空間大小不足以分配，則查找下一個 Free Space 分配，以此遞推。在內存空間充裕的條件下，這種方式比查找索引快，同時避免了創建索引消耗的時間。

我們接下來就來分析索引的創建和查詢：

根據上述，我們只會建立和使用索引 1 ，用於回收時合並相接的 Free Space 。

索引 1 在分配時創建（更新），在回收時查詢並更新。

索引 1 的索引項是這樣：最高位字節用來保存索引項的值，只會用到低位的 2 位，表示 4 種情況： 00 , 01 , 10 , 11 。后面再跟 4 個字節或 8 個字節表示指向的子索引項或者 Free Space 項的地址。如果是 32 位或 “Any CPU” 應用程序，則是 4 個字節，如果是 64 位應用程序，則是 8 個字節。

在分配時，用於分配的 Free Space 的大小（Size）和起始地址會發生變化。對於索引 1 ，只需根據起始地址來更新索引即可。

Free Space 的起始地址字段表示空閑空間的起始地址。同上，如果是 32 位或 “Any CPU” 應用程序，則是 4 個字節，如果是 64 位應用程序，則是 8 個字節。根據《我發起了一個 .Net 開源數據庫項目 SqlNet》 https://www.cnblogs.com/KSongKing/p/9501739.html 文中對於索引的論述，對於 32 位的數據，會建立 32 / 2 = 16 個索引項 -_- ，對於 64 位的數據，會建立 64 / 2 = 32 個索引項 -_- 。

所以，對於 32 位或 “Any CPU” 應用程序，分配時 Free Space 起始地址發生變化需要修改索引最多需要約 16 個索引項，或者說時間花費是 O(16) 。因為檢索 1 個索引項需要判斷 4 種情況： 00 , 01 , 10 , 11 。所以我們可以假設 1 次操作的時間是 4ns （4 納秒），那么 O(16) 的時間就是 16 * 4 = 64 ns （64 納秒）。而回收需要查找索引找到和回收的內存塊相鄰的 Free Space ，同時回收后可能更新相鄰 Free Space 的起始地址（合並），或者產生一個新的 Free Space ，對於前者，需要修改索引，對於后者，需要創建索引，但不管是哪種，最多需要檢索（修改）的索引項約 16 個，可以認為時間花費是 O(16) ，而回收時查找索引尋找相鄰 Free Space 的時間花費也可以認為是 O(16) ，所以加起來就是回收的時間花費是 O(16) + O(16) = O(32) ，同上，假設 1 次操縱的時間是 4ns ，則回收的時間花費是 32 * 4 = 128 ns （128 納秒）。當然分配和回收具體花費的時間還會包括修改 Free Space 起始地址， Next 指針，合並時刪除多余的 Free Space 項等，這些先忽略不計，在下面估算的時候會酌情估算進去。

一次分配的時間是 64ns ，再加上分配時可能發生的一些遍歷（在當前 Free Space 的大小不夠時，訪問下一個 Free Space 嘗試分配，以此遞推），就按 80ns 算， 1 秒鍾大概可以進行 1200萬次分配。如何？還行吧，呵呵。不過比起我想象中的 new ，還是慢了一點，我想象中的 new 應該是 1ns new 一個嘛！ P： new 就是分配。

一次回收的時間是 128ns ，就按 150ns 算， 1 秒鍾大概可以進行 600萬次回收。能不能再快一點？ ^^

對於 64 位應用程序，時間花費是 32 位的 2 倍，所以 1 秒鍾可以分配 600萬次，回收 300萬次。如何？哎？為什么 64 位反而慢了？

上面的分配和回收的執行速度是針對 1 個 CPU 核分析的，但對於多核，分配和回收的執行速度也是如此。因為堆是進程內所有線程共享的，堆表也是共享的，在進行分配和回收時要修改堆表，此時需要對堆表進行同步/互斥（Lock），所以，對於多核，分配和回收的執行速度也是如此。

從這里可以看出，堆的這一特性會成為瓶頸。在高頻高密度計算的場合。比如高並發實時響應式系統。說的直接一點，就是跟現在的互聯網大規模計算有關。

這一類型的瓶頸也表現在其它方面。比如套接字（Socket）， Socket 對於每個網卡只會有一個線程負責從網卡讀寫數據。這是我的推測。一個端口（Port）的 Socket 由一組線程組成： 1 負責從網卡讀寫數據的線程（1 個網卡對應 1 個線程）， 2 處理和分發數據給應用程序的線程們（有若干個線程，線程數和 CPU 的核數對應，可以包括虛擬線程(超線程) 數）。在線程 1 和線程 2 們協作的時候，會有一個共享數據區，線程 1 會把從網卡讀取到的數據放到共享數據區，線程 2 們會從共享數據區取出數據處理分發。顯然，線程 1 和線程 2 們的協作需要同步/互斥（Lock），

我們可以看一下這篇文章《面向對象編程的弊端是什么？》 https://www.zhihu.com/question/20275578/answer/136886316?utm_source=com.tencent.tim&utm_medium=social&utm_oi=697587017629851648

文中有一幅圖：

如圖紅線所示， Mutex（同步 / 互斥 Lock）的時間是 17ns （17 納秒）。這個時間是一個不太能忽視的時間。

所以，這會成為利用並行計算大幅提升計算能力的瓶頸。而利用並行計算大幅提升計算能力正是當下和未來的主題。

另外就是，一個網卡只有一個 IO 線程，這也可能成為瓶頸。當網絡技術發展到 5G 或 6G 的時候，會不會有 NPU（Net Process Unit）出現？就像 GPU 一樣。 ^^

實際上，對於堆表的無限增長，有一個 “終極” 的解決辦法，或者說更好的辦法。就是 GC （垃圾回收器）。

在現代，或者說 “當代” 的語言，如 C# , Java 里都有 GC 。 GC 可以將 Free Space 的數量控制在有限和很少的范圍。這樣就不存在堆表的無限增長了。

然后。

當然， GC 要登記所有變量，並定期遍歷，移動數據，這些也要花費時間的。

堆表的無限增長，這是一個問題。堆表增長，表示 Free Space 增多，碎片也增多，這樣在分配時可能會遍歷比較多的 Free Space 。

對於 64 位應用程序， 64 位理論上的尋址空間可以達到 16eb ，如果應用程序對於存儲空間的使用是沒有限制的，那么，一段時間之后，堆表，或者說 Free Space （包括碎片）的數量可能會達到很大的數量。

假想一下，如果 Free Space 很多，碎片也很多，那么可能要遍歷很多次才能找到大小足夠的 Free Space 進行分配。這個時候，我們可以考慮加入這樣的算法，最多遍歷 10 個 Free Space ，遍歷了 10 個 Free Space 還找不到大小足夠的 Free Space ，則向操作系統申請 1 個新的 div ，並將 div 作為新的 Free Space 插入到當前位置，並從這個 div（新的 Free Space）中分配。分配以后，下一次分配當然也會從這個 div 開始，如果這個 div 的剩余空間不夠，則訪問下一個 Free Space 。如果訪問了 10 個 Free Space 也找不到足夠大小的 Free Space ，則重復上述流程，向操作系統申請 1 個新的 div ，並將 div 作為新的 Free Space 插入到當前位置，並從這個 div（新的 Free Space）中分配。以此遞推。

這種方式，可能會浪費一些空間，或者說，會向操作系統申請多一些的空間（div），但是在時間上提高了效率。這也算是 “空間換時間” 吧。在現在來講，硬件容易擴充，提升計算速度是一個主要目標。

根據以上，我們再來整理一下具體的做法。

我們以 64位應用程序的標准來實現：

當進程啟動時，會分配一塊固定大小的連續空間，作為堆的基礎元數據區，基礎元數據區包括 5 部分：

1 Append 指針，指向堆表可插入堆表項的地址（當前最后一個堆表項之后），插入堆表項后， Append 指針會指向堆表項結束地址的下一個地址。 Append 指針的初始值應指向第 5 個堆表項的起始位置。因為會在堆表中預先建立 4 個 1 級索引項，見下面第 4 部分。

2 堆表的 Free Space 項鏈表頭指針，指向 Free Space 項鏈表的頭。（Free Space 項之間通過鏈表的方式連接起來）

3 當前 Free Space 項指針，指向上一次用於分配的 Free Space 項。下一次分配會先嘗試在上一次分配的 Free Space 中進行，若 Free Space 的大小不夠，會訪問下一個 Free Space 嘗試分配。分配成功后，當前 Free Space 項指針會指向分配成功的 Free Space 項。當然這里面還有些具體的邏輯，比如訪問超過 10 個 Free Space 項仍然找不到大小足夠的 Free Space ，則會向操作系統申請新的 div ，作為 Free Space 加入進來，然后在這個新的 div 中分配。

4 堆表的初始空間。堆表的初始空間可以是 1 MB 。進程啟動時，會初始化基礎元數據區，此時應在堆表的第 1 ~ 4 個堆表項位置預先建立 1 級索引項（00 , 01 , 01 , 11）。所謂初始空間是指這部分是固定不變的，之后堆表空間不夠用時，會在堆中申請新的堆表空間。這些新申請的堆表空間空出來的時候會歸還堆，但初始空間是不變的，不變是指一直存在，大小不變。且初始空間不屬於堆。

5 Next 指針，指向下一個堆表空間。隨着堆的規模的增長，堆表大小不夠時，會從堆里申請新的堆表空間，新的堆表空間會和初始空間用鏈表的方式連接起來，可以申請多個堆表空間，如：初始空間 -> 第 1 個新申請空間 -> 第 2 個新申請空間 -> 第 3 個新申請空間 -> …… 第 n 個新申請空間 -> ……

當堆的規模縮小時，會釋放空閑的堆表空間（歸還堆）。

初始空間不屬於堆，當然永遠不會釋放。

接下來，我們這樣來定義堆表項：

堆表項分為 2 種：

1 索引項

2 Free Space 項

具體規則是：

1) 索引項和 Free Space 項都占用 34 個字節。第 1 個字節是標識字節，為 1 表示索引項，為 2 表示 Free Space 項，為 0 表示已刪除。

2) 對於索引項，第 2 個字節表示索引值，就是 00 , 01 , 10 , 11 這 4 種值中的一種，實際上這 4 種值只用到了 2 位，不過我們還是用一個字節來存儲。如果是十進制表示這 4 個值，就是 0 , 1 , 2 , 3 。我們設計的是 4 階索引，第 3 ~ 10 個字節存儲第 1 個子索引項或 Free Space 項的地址（64 位地址用 8 個字節存儲），第 11 ~ 18 個字節存儲第 2 個子索引項的地址，第 19 ~ 26 個字節存儲第 3 個子索引項的地址，第 27 ~ 34 個字節存儲第 4 個子索引項的地址。若 8 個字節表示的 64 位地址（ulong 無符號長整型 uInt64）為 0 ，表示子項不存在。有關索引和 4 階索引，我在《我發起了一個 .Net 開源數據庫項目 SqlNet》 https://www.cnblogs.com/KSongKing/p/9501739.html 一文中有論述。

所以，可以看出，索引項長度是 1 + 1 + 8 + 8 + 8 + 8 = 34 個字節。

3) 對於 Free Space 項，第 2 ~ 9 個字節表示起始地址，第 10 ~ 17 個字節表示結束地址。第 18 ~ 25 個字節表示所在的 div 的起始地址。第 26 ~ 33 個字節表示 Next 指針指向下一項 Free Space 項（Free Space 項之間會通過 Next 指針來用鏈表的方式連接起來）。 Free Space 項的長度是 1 + 8 + 8 + 8 + 8 = 33 個字節。

為了便於管理， Free Space 項的長度也定義為 34 個字節，和索引項一樣。多出來的 1 個字節不會用到。

將索引項和 Free Space 項都定義為 34 位是便於管理，或者說便於算法處理。堆表進行垃圾回收的時候，只需要每隔 34 個字節檢查一次標識字節，就可以知道堆表項是否已刪除，若已刪除則將后面的堆表項移動上來，填補已刪除的空閑空間。這就是堆表的垃圾回收。

div ，接下來說明 div 的定義規則。 div 是進程向操作系統申請的一塊大的內存區域，用於作為堆空間。

第 1 次分配內存塊時會申請第 1 塊 div 。如果從來沒有申請過內存塊，則不會申請 div 。

div 分為 3 個部分：

1 結束地址， div 的結束地址，用 8 個字節表示（ulong 無符號長整型 uInt64）

2 分配計數器 useCount ，用於記錄分配的內存塊數量，若計數器的值為 0 ，表示 div 完全空閑，即沒有分配任何空間，可以歸還操作系統。當然剛申請到 div 的時候，計數器的值也是 0 ，不過那時會接着用於分配。計數器也用 8 個字節表示（ulong 無符號長整型 uInt64）

3 剩余的空間用於分配。

接下來說明運行邏輯：

我們先估算一下， 1 MB 的堆表空間夠存放多少個 Free Space 項（包含索引項）？

Free Space 項的地址是 64 位地址，要為 64 位地址建立索引，需要 64 / 2 = 32 個索引項。每個索引項占據的空間是 34 個字節，再加上 Free Space 項占據的 34 個字節， 1 個 Free Space 需要的存儲空間是 (32 + 1) * 34 = 1122 個字節。實際中會比 1122 小，因為索引的父節點存在共用的現象。我們可以按 1024 來算，存儲一個 Free Space 需要 1024 個字節（包含索引項），那么 1 MB 可以存儲 1024 個 Free Space（包含索引項）。

所以， 1 MB 的堆表可以記錄 1024 個 Free Space ，如果應用程序申請和歸還內存塊產生的 Free Space 不超過 1024 個的話， 1 MB 的堆表就夠了。如果超過，則需要申請新的堆表空間。新的堆表空間在堆中申請。可以仍然申請 1 MB 。如果新申請的 1 MB 堆表空間用完了，可以繼續申請 1 MB ，以此遞推。當然，實際中不會等到堆表空間不夠用時才去申請新的堆表空間，上文分析過，如果這樣的話，會陷入 “自己描述自己” 的循環中，所以，應該在快用完（至少還足夠保存一次申請產生的最大的 Free Space 變化 ( 包含索引項 ) ）的堆表空間時就申請新的堆表空間。

當應用程序第 1 次申請內存塊時，堆管理程序會檢查基礎元數據區的第 1 個 div 的起始地址，若為 0 （div 不存在），就向操縱系統申請 div ，申請到后將 div 的起始地址記錄到基礎元數據區的 “第 1 個 div 的起始地址” 。

然后，將 div 的第 3 部分（用於分配的空間）作為 1 個 Free Space 記錄入堆表（這是第 1 個 Free Space）。當然，記錄的操作包括了建立索引。注意， 1 級索引項（00 , 01 , 10 , 11）固定存儲在堆表的第 1 ~ 4 個堆表項位置。應用程序啟動，初始化基礎元數據區時應預先建好這 4 個索引項。

接下來，就開始在堆表中訪問 Free Space 進行分配，當然現在只有 1 個 Free Space ，就是上面剛添加進去的 Free Space 。分配的話，就從 Free Space 的起始地址開始分配。比如，要申請 1 KB 的內存塊，那么就把 Free Space 起始地址 ~ Free Space 起始地址 + 1 K - 1 這塊內存分配給應用程序。如果申請的內存塊大小比這個第 1 個 Free Space 都大，那么應該拋出異常 “只允許申請大小在 xx 范圍內的內存塊” 。

分配的具體工作：修改當前 Free Space 的起始地址，修改為 Free Space 起始地址 + 1 K ，同時修改索引，根據 Free Space 原來的起始地址遍歷索引項，遍歷到和新的起始地址不同的索引項就修改索引項。這么說好像不知道在說什么。好吧，我們舉個具體的例子：

我們的設計是 64 位地址，舉例的話就簡單一點，我們以 8 位地址為例，假設 Free Sapce 的起始地址是 0 （0000 0000），申請 4 個字節大小的內存塊。

申請前 Free Space 的索引是這樣的： 00 -> 00 -> 00 -> 00 ，申請后 Free Sapce 的起始地址會變成 4 （0000 0100），相應的，索引會變成： 00 -> 00 -> 01 -> 00 ，可以看到，從第 3 個索引項開始，新的索引和舊的索引變得不同，所以我們從第 3 個索引項開始修改為新的索引項就可以了。

整個修改索引的過程會遍歷全部的索引項（包含了修改）， 64 位地址是 32 個索引項，所以分配的時間復雜度約大於 O(32) （還要考慮其它的操作，所以是約大於），我們上文中就是這樣估算的。

其它還有什么操作呢，好像沒有了。 ^^

分配就 2 步操作： 1 修改 Free Space 起始地址， 2 修改索引。

接下來是歸還，歸還分為 4 種情況：

1 歸還的內存塊的前后不和已有的 Free Space 相接，這樣歸還會產生一個新的 Free Space 。

2 歸還的內存塊和前面或者后面已有的 Free Space 相接，這樣需要和相接的 Free Space 合並。

3 歸還的內存塊和前面和后面已有的 Free Space 相接，這樣需要和前后 2 個 Free Space 合並。

4 歸還的內存塊沒有相鄰的 Free Space ，這種情況比較特殊，這種情況就是整個 div 的內存完全被分配出去的情況。

具體流程是這樣：

應用程序將內存塊的起始地址提供給堆來歸還這塊內存塊。堆根據內存塊的起始地址查找索引，查找和內存塊前相鄰的 Free Space 。前相鄰，是指相鄰且在前面。什么是前面？ Free Space 的起始地址小於內存塊的起始地址叫前面，大於叫后面。

根據索引查找到前相鄰的 Free Space ，還不一定是真正的前相鄰的 Free Space ，還要加一個判斷條件： Free Space 所在的 div 和內存塊所在的 div 是同一個 div ，這樣才是前相鄰的 Free Space 。

我們這樣來定義前相鄰后相鄰：

前相鄰：起始地址小於內存塊的起始地址，且和內存塊屬於同一個 div ，則為前相鄰。

后相鄰：起始地址大於內存塊的起始地址，且和內存塊屬於同一個 div ，則為前相鄰。

如果查找不到前相鄰，那么就根據基礎元數據區里的 Free Space 鏈表頭指針找到頭指針指向的 Free Space 項，這個 Free Space 項就是內存塊的后相鄰。

如果 Free Space 鏈表頭指針為空（0），也表示沒有相鄰（既沒有前相鄰，也沒有后相鄰）。

什么情況下 Free Space 鏈表頭指針為空（0）呢？在應用程序初始化后，還沒有分配的時候。以及分配以后，整個 div 都被分配出去。如果有多個 div ，所有 div 都被完全的分配出去，頭指針也為空（0）。

頭指針不空，可以找到起始地址大於或小於內存塊起始地址的 Free Space ，但 Free Space 和內存塊不在同一個 div 的話，也不是相鄰。

怎么判斷 Free Space 和內存塊在不在同一個 div ？ Free Space 項有一個字段是所在 div 的起始地址， div 的第 1 個部分是 div 的結束地址（見上文對 div 的定義），根據 div 的起始地址可以找到 div 的結束地址，根據 div 的起始地址和結束地址可以判斷內存塊在不在 div 里。

找到前相鄰后，判斷前相鄰的結束地址 + 1 和內存塊的起始地址是否相等，若相等，則兩者應合並。但這里還要進一步的判斷，是情況 2 還是情況 3 ，所以還需要根據前相鄰的 Next 指針找到下一個 Free Space 項，這就是后相鄰。判斷后相鄰的起始地址和內存塊的結束地址 + 1 是否相等，若相等，表示是情況 3 ，若不等，表示是情況 2 。

如果沒有相鄰的 Free Space ，就是情況 4 。如果有相鄰的 Free Space ，但既不是情況 2 ，也不是情況 3 ，就是情況 1 。

對於情況 1 ，需要新建一個 Free Space 項，插入到 Free Space 項鏈表里，插入位置是內存塊的前相鄰之后，或者說，后相鄰之前。當然，新建 Free Space 項需要建立相應的索引。索引有 32 個索引項，所以新建 Free Space 的時間復雜度約大於 O(32) 。再加上查找前相鄰的時間復雜度 O(32) ，所以情況 1 的時間復雜度約大於 O(32) + O(32) = O(64) ，約大於 O(64) 。上文就是這樣估算的。

對於情況 2 ，如果和前相鄰相接，就修改前相鄰的結束地址和索引就可以，如果和后相鄰相接，修改后相鄰的起始地址和索引就可以，這個和分配的操作方法一樣，參考上文分配的部分就可以。

對於情況 3 ，可以修改前相鄰的結束地址和索引，同時刪除后相鄰，相應的，后相鄰的索引也要刪除。刪除索引的步驟是：根據后相鄰的起始地址遍歷索引項，對於只有 1 個子索引項的索引項刪除即可。只有一個子索引項表示從當前索引項開始的索引路徑僅僅指向要刪除的這個后相鄰。

對於情況 4 ，直接按照內存塊的起始地址結束地址新建一個 Free Space 項，添加到 Free Space 堆表，當然會建立相應的索引。同時，還要將 Free Space 項插入 Free Space 項鏈表里。插入位置在 —— 根據索引查找出起始地址小於自己的 Free Space 項，插入到這一項之后就行。注：因為不在同一個 div ，所以不能叫前相鄰或者后相鄰。如果查找不到起始地址小於自己的，就插入到頭，即基礎元數據區里的 Free Space 鏈表頭指針指向自己，自己的 Next 指針指向原來頭指針指向的那一項。如果頭指針原來是空（0），那就讓頭指針指向自己就可以了。

Free Space 項鏈表不是一個獨立的東西，而是堆表里的 Free Space 項之間會通過 Next 指針來用鏈表的方式連接起來。因為只有 Next 指針，所以是單向鏈表。現在看起來，單向鏈表夠用了。 -_- '

每次申請和歸還后會檢查是否進行垃圾回收，當滿足以下 2 個條件時進行垃圾回收：

1 Append 指針到堆表結束地址的內存空間小於 1500 個字節時，

2 堆表的空閑空間超過堆表空間的 2/3 的時候

每次垃圾回收后會檢查是否需要擴充堆表，當滿足以下條件時擴充堆表：

Append 指針到堆表結束地址的內存空間小於 1500 個字節時，

擴充堆表就是申請新的堆表空間和初始空間用鏈表的方式連接起來，當然，隨着堆的規模的擴大，可以申請第 2 個、第 3 個、第 n 個 …… 堆表空間，用鏈表的方式連起來就是：初始空間 -> 第 1 個新申請空間 -> 第 2 個新申請空間 -> 第 3 個新申請空間 -> …… 第 n 個新申請空間 -> ……

這一點的意義上面已經多次分析過，為了避免陷入 “自己描述自己” 的陷阱，所以需要在堆表空間快用完時，擴充堆表空間。堆表空間最少要能夠存儲一次分配（包含可能申請 div 的情況）所產生的 Free Space 項（包含索引項）。一般的分配只需修改 Free Space 項的起始地址和索引，當有申請 div 的情形時，會新建 Free Space 項及完整的索引（32 個索引項），這應該是分配時占用空間最大的情況，我們按這種情況來計算。上面說過， 1 個 Free Space （包含索引項）會占用 1122 個字節，我們放寬松一點，在堆表剩余空間只有 1500 個字節時就擴充堆表。

那什么時候 “壓縮” 或者說釋放空閑出來的堆表空間呢？

在垃圾整理后，檢查最后一個 “不空” 的堆表空間，即最后一個存儲了至少 1 個堆表項的堆表空間，如果這個堆表空間的空閑空間超過堆表空間的 2/3 ，那么將釋放這個堆表空間之后所有的堆表空間。釋放就是將堆表空間歸還堆。上文說了，初始空間以外的堆表空間都是從堆里申請的。

初始空間不屬於堆，顯然，永遠不會釋放。

說到這里，顯然， “堆表” 是一個可擴充的，由若干個線性表通過鏈表的方式連接起來的數據結構。

Append 指針指向的是最后一個堆表項，這個堆表項可能在初始空間，也可能在新申請的第 n 個堆表空間。

在分配時，會從當前 Free Space 項指針指向的 Free Space 項開始嘗試分配，如果當前項大小不夠，會訪問下一個 Free Space 項，如果訪問超過 10 個 Free Space 項還找不到大小足夠的 Free Space ，則會向操作系統申請新的 div ，作為 Free Space 加入進來，然后在這個新的 div （新的 Free Space）中分配。

這主要是從執行速度的角度考慮。這也算是 “空間換時間” 。

這邏輯真的亂，煩。

我們可以用文件的方式來模擬實現這個堆管理算法。

就是用一個文件模擬一塊內存區域，來實現這個堆算法。

我們會先實現一個 EnLargableList 的數據結構， EnLargableList 是一個線性表通過鏈表的方式連接起來的可擴充的數據結構，用來實現堆表。

堆的復雜來自於堆表的動態增長（無限增長），如果堆表是固定大小的，那么堆並不太難。

上面有一個地方的邏輯有漏洞，向操作系統申請了一個 div 之后，除了將 div 可分配的空間作為一個 Free Space 項加入 Free Space 項鏈表外，還應該新建一個 “空的” Free Space 項加入。這個 “空的” Free Space 項的起始地址和結束地址都是 div 的可分配空間的起始地址。因為起始地址和結束地址相等，所以是 “空的” 。因為大小是 0 ，總是小於申請的內存塊的大小，所以，在分配的時候不會分配這個 Free Space 。

這個空的 Free Space 有什么用呢？這是為了解決整個 div 都被完全的分配出去的情況，上文分析過了，整個 div 都被完全的分配出去的話， Free Space 鏈表里就沒有這個 div 的 Free Space ，這樣當這個 div 里的內存塊歸還時，會找不到前相鄰和后相鄰，從而不知道這個內存塊是哪個 div 的，這樣歸還的邏輯就有問題，就算不管是哪個 div 而直接將內存塊作為 Free Space 歸還，最終也會導致即使這個 div 已經全部空閑（所有分配出去的內存塊都歸還了），但是無法將這個 div 歸還操作系統。相當於這個 div 處於 “半遺棄” 的狀態。因為它的 Free Space 仍然可以繼續分配和歸還，但這個 div 已經不在正式名單上了，無法在全部空閑時歸還操作系統。當然，實際中這樣的操作是不允許的，因為 Free Space 項最后一個字段就是指向自己所在 div 的起始地址，就是說 Free Space 項應該知道自己所在的 div ，如果不知道，程序不能運行下去。

所以，每個 div 一定會有一個空的 Free Space ，不管 div 的空間如何分配，這個空的 Free Space 會一直存在下去，直到 div 歸還操作系統，這個空的 Free Space 才會被刪除。

因為我們沒有專門的表來記錄 div ，所以這個空的 Free Space 相當於 div 的代表，或者占位。

上面的做法還是有一點問題。用一個 “空的” Free Space 來表示 div 會有一些問題。實際上 “空的” Free Space 不是空的，是大小為 1 個字節的空間。起始地址和結束地址相等， Free Space 的大小 = 結束地址 - 起始地址 + 1 = 1 。所以，在歸還 Free Space 時，如果歸還的 Free Space 和這個 “空的” Free Space 相接，會和 “空的” Free Space 合並，這又會引出合並后下次分配時第 1 個字節不能分配（作為 “空的” Free Space）之類的判斷，會把算法邏輯變復雜。

所以，我們放棄了這種方式。正統的做法應該還是把 div 記錄到堆表里，也會為 div 建立索引。也就是說，增加一種堆表項： div 項。標識字節（第 1 個字節）為 3 表示 div 項。 div 項的第 2 ~ 9 個字節存儲 div 的起始地址。當然 div 項的長度也是 34 （和索引項 Free Space 項相同），多余的字節不會用到。

這樣，在歸還內存塊時，如果找不到前相鄰，也找不到后相鄰，說明 div 被完全分配出去了，此時就會根據索引查找 div ，找到起始地址小於內存塊的起始地址且相鄰的 div ，這就是內存塊所在的 div 。

歸還內存塊后， div 的分配計數器會減 1 ，減 1 后檢查計數器值是否為 0 ，若為 0 則 div 的空間已完全空閑，於是將 div 歸還操作系統。

但這樣的做法還是有問題，要為 div 建立索引，這有一點額外的麻煩，比如現在的堆表項開始的 4 個項位置存儲的是 4 個 1 級索引項，如果要為 div 建立索引，需要專門再為 div 建立 4 個 1 級索引項，這些會增加算法內容，會變得復雜或者麻煩。

所以，我們還是回到用一個 “空的” Free Space 來表示 div ，或者占位的做法。在申請一個新的 div 的時候，會創建 2 個 Free Space ，一個是 “空的” Free Space ，另一個是可用的 Free Space 。 div 的開頭會用 8 + 8 = 16 個字節分別表示結束地址和分配計數器 use Count ， “空的” Free Space 就是第 17 個字節，起始地址和結束地址都是第 17 個字節，從第 18 個字節開始就是可用空間了，可用的 Free Space 就是第 18 個字節開始到 div 的結束地址。

我們可以給 Free Space 項增加一個字節來表示 Free Space 的 “Type” ，在標識字節之后。第 1 個字節是標識字節，我們用第 2 個字節來表示 Free Space Type ， 0 表示 “空的” Free Space ， 1 表示普通的 Free Space 。這樣的話， Free Space 項和索引項一樣，都是 34 個字節了。

在分配和回收時需要判斷 Free Space 時 “空的” Free Space 還是普通的 Free Space 。上文中定義過，標識字節為 2 表示普通的 Free Space 。

在分配時判斷，如果是 “空的” Free Space ，就不進行分配，而是訪問下一個 Free Space 嘗試分配。

在回收時會尋找前相鄰，如果前相鄰是 “空的” Free Space ，則不進行判斷是否相接若相接則合並的邏輯。

EnLargableList （用於堆表）會設定這樣一些參數：

1 whenRecycleFragment ，這是一個整數，表示碎片數量超過多少應開始碎片回收，可以設置為 1萬，碎片數量是以對表項為單位。假設堆表空間是 1MB ，每個堆表項占用 34 個字節，可以存約 3 萬個堆表項，約表示 1024 個 Free Space （每個 Free Space 最多由 33 個堆表項表示，包含 32 個索引項 + 1 個 Free Space 項）。

如果設置 whenRecycleFragment 為 1 萬，相當於是一個堆表空間中有 1/3 的空閑空間，此時回收。效果怎么樣？不知道。

或者說相當於一個堆表空間中記錄了 600 個 Free Space 項，還有 300 個 Free Space 的位置可以記錄，此時回收。效果怎么樣？不知道。

上文中提到當 Append 指針到堆表空間的結束位置的空間小於 1500 時回收，但現在放棄了這種做法。

因為這種做法好像不太科學，在應對規模很大的堆時候，好像不太適用。堆的規模很大，是指可以無限制的使用地址空間，內存塊數量和 Free Space 數量（包含碎片）可能持續增長。大小 1MB 的堆表可以存約 3 萬個堆表項，以堆表項為單位遍歷一遍需要遍歷 3 萬個堆表項。 3 萬是一個不小的數量，所以我們想當碎片（空閑出來的項位置）達到 1 萬的時候回收可能會比較好。

2 whenEnLarge ，這是一個整數，表示 append 指針到堆表末尾的空間還有多少時擴充堆表容量，擴充堆表容量就是申請新的堆表空間，新申請的堆表空間以鏈表的方式連接到當前堆表空間。

3 heapTableSpace ：就是每一個堆表空間的大小，可以設為 1MB ，每次申請新的堆表空間就是申請 heapTableSpace 大小的一個內存塊。

EnLargableList 還會保存這樣一些字段：

1 appendPtr ， append 指針，存儲一個 64位地址， EnLargableList 寫入數據時從 append指針指向的數據開始寫，每寫入一段數據， append 指針會移動到這段數據之后的位置。

2 currentHeapTableSpace ，當前堆表空間，即 append 指針指向的位置所在的堆表空間。這個字段用來歸還堆表空間。歸還是指，當末尾一個堆表空間，即當前堆表空間的空間全部空閑出來時候，會將堆表空間歸還堆。僅僅憑 append 指針不能知道 append 指針所在的堆表空間，所以還需要這個字段來記錄 append 指針所在的堆表空間，即當前堆表空間。

3 recycleFreeItem ，碎片回收時指向空閑的項位置，即 “碎片” ，或者說 “已刪除”的項。

4 recycleScanItem ，碎片回收時會先掃描 “碎片” ，掃描到一個 “碎片” 之后，會將 recycleFreeItem 指向這個 “碎片” 的位置。然后會掃描堆表項，每掃描一個堆表項，會檢查堆表項的子項（子索引項 Free Space項），若子項的位置大於 recycleFreeItem 指向的位置，則將子項移動到 recycleFreeItem 指向的位置， “填補”這個碎片，同時修改當前掃描的堆表項中保存的該子項的位置。這樣就完成一個 “碎片” 的回收（“填補”）。

然后就繼續掃描下一個 “碎片” ，掃描到 “碎片” 后，又接着掃描上一次掃描的堆表項。怎么知道上一次掃描的堆表項？就是 recycleScanItem 指向的堆表項。不過這樣看起來，還要加一個字段，來表示掃描到了堆表項里的哪個子項，如下：

5 recycleScanSubItem ，表示掃描到的堆表項的子項。這個字段只要 8 位整數就可以了。

6 fragmentCount ，表示 “碎片” 數量，每次刪除堆表項時加 1 ，在碎片回收 “填補” 碎片的時候減 1 ，這個字段用於上文中如果 fragmentCount 的數量達到 whenRecycleFragment 的值的時候，就開始碎片回收。

7 堆表空間的 useCount ，這個字段是每個堆表空間保存 1 個，就是堆表空間的 useCount ，就是堆表空間使用的計數（以堆表項為單位）。每寫入 1 個堆表項，就在堆表空間的 useCount 加 1 ，每刪除 1 個堆表項， useCount 就減 1 。 useCount 為 0 表示堆表空間

每次分配和回收之后會檢查 fragmentCount ，當 fragmentCount 超過 whenRecycleFragment 時會開始回收。由於不希望回收占用太多時間，可以設定一個參數比如 recycleItemCount ，比如 300 ，表示不管有沒有回收完，只掃描 300 個堆表項。

但這樣會有一個問題，本身要 fragmentCount 超過 whenRecycleFragment 時才開始回收，而且每次又不回收完，空閑出來的碎片空間得不到重復利用， append 指針只能一直向后移動，所以可能導致永遠回收不完，堆表持續增長。

所以 ……

我們這里有了一個突破，即對於堆表的碎片回收，我們采用了一個新的算法，就是在堆表項里增加 1 個字段： fragmentNext 。

就是把已刪除的堆表項（碎片）用鏈表的方式連接起來，這樣每次寫入堆表項的時候從這個鏈表的頭取出一個碎片，作為新的堆表項的寫入位置。 fragmentNext 表示下一個碎片的位置，或者說， fragmentNext 是一個指針，指向下一個碎片。

實際上是一個用鏈表實現的隊列。

所以，需要在基礎元數據區里增加 2 個字段 fragmentListHead , fragmentListTail ，用於保存碎片鏈表（隊列）的頭指針和尾指針。

每次刪除堆表項時，將被刪除的堆表項的標識字節更新為 0 ，表示已刪除，同時將堆表項添加到碎片隊列的尾部。

如果是第一次刪除，那么碎片隊列里還沒有元素，則將頭指針和尾指針都指向堆表項。

每次寫入堆表項的時候，會先從碎片隊列里取得碎片，作為寫入位置，如果碎片隊列為空，才會將 append 指針作為寫入位置。

fragmentNext 指針也是一個 64位無符號整數 ( uInt64 ) ，所以也占用 8 個字節。這樣的話，索引項和 Free Space 項的大小都是 34 + 8 = 42 個字節了。

好的，現在我們再來看看在這種算法下，如何回收碎片。（這里的 “碎片” 是指堆表里的碎片，不是堆里的碎片）

實際上，在這個算法下，碎片可以得到充分的利用（每次寫入都優先從碎片隊列中取得碎片作為寫入位置，碎片隊列為空才會用 append 指針的方式），所以看起來堆表不會無理增長。但又一些特殊的情況，比如應用程序先申請了大量的小塊內存，造成了大量的 Free Space ，為了存儲這些 Free Space ，堆表會變得很大，之后應用程序又歸還了所有或者大部分內存塊，也是 Free Space 會變得很少，此時堆表中就會產生大量空閑空間（碎片），這些空閑空間如果長時間不用又不歸還堆，也是一種浪費。

我們可以這樣來設計堆表的碎片回收算法：

首先，只有碎片數量大於某個值的時候，才會開始回收。比如大於 1000 個碎片（約 1 MB）。

從初始空間開始，向后遍歷每一個堆表空間，如果堆表空間的 useCount 為 0 ，則可以考慮釋放這個堆表空間（歸還堆）。

注意，這里是考慮，不是一定要歸還。還要判斷一個條件，就是堆表的可用空間 usableSpace 是否足夠，若足夠則釋放（歸還）堆表空間，否則不釋放。注意 usableSpace 是整個堆表的可用空間（包括所有的堆表空間）。

堆表的初始空間不屬於堆，屬於基礎元數據區，永遠不會釋放。

所以在基礎元數據區中要增加一個字段 usableSpace ，上文的一些算法邏輯也要做一些修改。

usableSpace 初始值等於初始空間的大小。之后每申請一個新的堆表空間，則加上新的堆表空間的大小，若歸還堆表空間，則減去歸還的堆表空間的大小。

每次向堆表寫入數據， usableSpace 加上寫入數據的長度，比如 1 個堆表項長度是 34 個字節，那么寫入一個堆表項的話， usableSpace += 34; 。

每次從堆表中刪除數據， usableSpace 減去刪除數據的長度，比如刪除 1 個堆表項，則 usableSpace -= 34; 。

上文中的 append 指針到堆表末尾的空間小於 1500 時應擴充堆表（申請新的堆表空間）這一段需要改成：

usableSpace 小於 1500 時，應擴充堆表（申請新的堆表空間）。上文中也提到如果一個堆表空間的 useCount 為 0 ，則可以考慮釋放這個堆表空間，但要判斷一個條件，即堆表的可用空間 usableSpace 是否足夠。我們可以設定比如當 usableSpace - 當前考慮釋放的堆表空間的大小 > 50 萬個字節（可以存儲約 500 個 Free Space 項 (包含索引項)）時，可以釋放這個堆表空間。

我們上文設定的 1 個堆表空間的大小是 1MB ，所以 50萬個字節約等於 0.5 MB ，上面的條件相當於是釋放了這個堆表空間后，堆表的可用空間還有 0.5 MB ，也就是相當於還有半個堆表空間。

這些參數可以根據需要進行設定，上面給出的是參考數值，也是舉例。

歸納一下，就是 usableSpace 小於 1500 時應擴充堆表， usableSpace - 考慮釋放的堆表空間大小大於 50萬時可以釋放堆表空間。

是不是更清晰了？

碎片回收應放在一個另外的線程里進行。（是不是想起了 GC -_- ' ），每隔一段時間運行一次（比如每秒運行一次），如果堆表空間的數量很大，可以每次只遍歷幾個堆表空間（比如 10 個），后面的下次繼續遍歷。這樣可以不影響分配和回收內存塊的執行速度。

（這里的 “碎片” 是指堆表里的碎片，不是堆里的碎片）

為了能在更新索引時只上溯到索引項值不同的索引項，需要再在索引項和 Free Space 項里再增加一個字段， parentItem ，保存上一級索引項的地址，是一個 ulong 無符號長整型，占 8 個字節，這樣，索引項和 Free Space 項的長度就是 42 + 8 = 50 了。

更新索引時只上溯到索引項值不同的索引項，可以避免為了更新一個 Free Space 項的索引項而刪除這個 Free Space 項的全部索引項並重建全部索引項。刪除全部索引項再重建可能會比較省事一些，但效率上可能會低一點。

上溯的邏輯是檢查上一級索引項的索引值和新索引在這一層級的索引項的索引值是否相等，如果相等，則在這一級索引項上開始向下建立新索引的索引項，如果不等，則檢查這個 “上一級” 索引項除了當前索引項以外還有沒有其它子項，如果沒有，則刪除這個 “上一級” 索引項之后繼續上溯，如果有，則直接繼續上溯。刪除 “上一級” 索引項當然包括了刪除當前索引項，實際上，上溯是從 Free Space 項開始， Free Space 項是索引樹的最底層，也可以說是葉子節點，也可以說是索引最終指向的數據，或者說數據項。

實際上 “上溯” 這個邏輯好像行不通，因為上溯到索引值和新索引在這一層級的索引值相同這並不能說明更上層的索引值和新索引的對應相同。要知道更上層（或者說每一層）的索引值是否和新索引的對應相同，需要一直上溯到頂層（一級索引），但這和從一級索引自頂而下好像沒什么區別。啊哈哈

為了簡單起見，我們采用刪除舊索引，建立新索引的方式。即更新索引采用刪除舊索引建立新索引的方式。

我們來看一下這樣的做法的時間花費：

對於申請內存塊（new），需要更新用於分配內存塊的 Free Space 的索引，按照上述的做法，更新包括了刪除舊索引和建立新索引，刪除舊索引和建立新索引的時間復雜度都可以認為是 O(32) ，加起來就是 O(32) + O(32) = O(32 + 32) = O(64) 。按照我們在上面的估算方法， O(1) 的時間按 4ns （4納秒）算，那么申請內存塊（new）的時間花費就是 64 * 4 = 256 ns 。 256 ns 我們按 300ns 算的話， 1 微秒就可以執行 3.3 次 new 操作， 1 秒就可以執行 330 萬次 new 操作。因為我們將 256 ns 近似為 300 ns 計算，所以可以認為 1 秒可以執行 330 萬次以上的 new 操作。

對於歸還內存塊（delete），分為 4 種情況：

情況 1 ：歸還的內存塊前面和后面都不和已有的 Free Space 相接，所以不需要 “合並”，這樣只需要新建索引就行，時間復雜度是 O(32) ，時間花費是 32 * 4 = 128 ns ，可以估算為 1 微秒可以執行 7 次，那么 1 秒可以執行 700 萬次。

情況 2 ：歸還的內存塊前面和已有的 Free Space 相接，需要 “合並”。合並只需更新相接的 Free Space 的結束地址就行。因為索引是按 Free Space 的起始地址建立的，所以更新結束地址不需要更新索引，所以情況 2 的時間復雜度是 O(1) ，由於只是更新結束地址，可以認為 O(1) 的時間花費是 1 * 1ns = 1ns ， 1 秒可以執行 10 億次。我也有點懷疑，真的這么簡單嗎？

情況 3 ：歸還的內存塊后面和已有的 Free Space 相接，需要 “合並”。合並只需更新后面相接的 Free Space 的起始地址，由於索引是按起始地址建立的，所以需要更新索引，和申請內存塊一樣，更新索引包含刪除舊索引和建立新索引，時間復雜度是 O(64) ，時間花費是 64 * 4 = 256ns ， 1 秒可以執行 330 萬次以上。

情況 4 ：歸還的內存塊前面和后面都和已有的 Free Space 相接，需要將前面后面的 Free Space “合並” 為一個。合並需要修改前面的 Free Space 的結束地址，刪除后面的 Free Space 。修改結束地址不需要更新索引，所以只需要刪除后面的 Free Space 的索引就行。所以時間復雜度是 O(32) ，和情況 1 一樣，時間花費是 32 * 4 = 128 ns ， 1 秒可以執行 700 萬次。

哎？我剛又想到一個好主意，申請內存塊的時候為什么不從 Free Space 的結束地址分配呢？如果從 Free Space 的結束地址分配的話，就不用更新索引，只要修改 Free Space 的結束地址就可以了。這樣就和歸還的情況 2 一樣，時間復雜度是 O(1) ，時間花費是 1 * 1ns = 1ns ， 1 秒可以執行 10 億次。（1 秒可以 new 10 億次）

上面的討論是從起始地址開始分配內存塊的，所以每次 new 的時候會更新起始地址，也就會更新索引。

如果換成從結束地址一端來分配內存塊的話，就不需要更新起始地址，也就不需要更新索引，可以大大提高效率。

當然這是在 Free Space 的大小足夠分配的情況下，如果 Free Space 的大小不夠，會向后尋找 Free Space，若尋找了 10 個 Free Space 還未找到大小足夠的 Free Space，則會向操作系統申請 div 。在這些情況下，還需要考慮這些時間花費。

因為不需要上溯，所以索引項和 Free Space 項不需要保存上一級索引項的位置（地址），也就是不需要 parentItem 這個字段，這樣的話，索引項和 Free Space 項的長度就從 50 個字節變回 50 - 8 = 42 個字節了。

實際上，我們在索引項里設計了一個字段用來保存索引值，但后來發現，由上一級索引保存的 4 個子索引項的指針字段可以直接指向子索引項，子索引項好像不需要保存索引值。

我這個設計是不會回收堆里的碎片的。這跟 C# Java 之類有 GC 的不同。我想 C++ 也不會回收堆里的碎片。上文提到的 “碎片回收” 是回收堆表里的碎片，不是回收堆的碎片。所以不存在 “全盤整理” 。每次歸還內存塊的時候會檢查 div 的 useCount ，每次分配內存塊的時候，這個內存塊所在的 div 會 useCount ++ ，每次歸還內存塊，這個內存塊所在的 div 會 useCount -- 。如果 useCount == 0 ，則將 div 歸還操作系統。但這種情況概率可能不大，因為一旦 div 投入使用后，分配出去的內存塊必須全部釋放， div 才會空（useCount == 0），才能歸還操作系統。但在實際使用中， div 投入使用后，有申請有歸還，全部清空的概率可能不大，很長時間后，可能還有一些 “零碎” 的內存塊占據着，即使是少量的內存塊，也導致 div 不能歸還。這就是 C++ 這一類靜態做法的局限。可能導致大塊內存區域（div）被進程占據，無法回歸到操作系統層面，造成資源的浪費。

所以，要解決這種靜態做法的局限，就需要引入 GC 這樣的動態特性。我想，當初 GC 的出現（以 Java 為代表），不僅僅是為了解決 “內存泄漏” 的問題，其實也隱藏了上述靜態做法的種種局限的原因吧！

當然， GC 的做法會增加工作量，會花費時間，但是， GC 確實可以有效的控制堆碎片數量和堆表大小。就是說， GC 可以使堆碎片控制在一個有限的范圍內，使堆表大小控制在一個有限的范圍內，這本身就簡化了問題，減少了管理開銷和復雜度。從這個角度來講， GC 又是減小了時間花費，提升了效率的。

所以，從技術進步或者進化的角度來看， GC 是一次進化，使得可以用更現代更高級的方法來管理存儲資源。

相較之下， C++ 的靜態做法，是早期和朴素的。

在現代存儲資源可以大幅甚至無限擴展的情形下，或許確實需要 GC 這樣 “動態” 的方式來管理存儲資源。靜態的方式面對大幅存儲資源可能會有局限。

當然，在本文中設計的這種 “靜態”做法，實際上也是利用了現代存儲資源大幅提升的特點，比較多的應用了 “空間換時間” 。

但確實存在一個問題，就是靜態的做法無法控制碎片的增長，包括堆碎片，甚至堆表碎片，或者說不能有效控制堆表大小的增長。本文的做法可以回收堆表碎片，但是效果如何，不知道。只要堆表空間里還有一個堆表項，就不能釋放堆表空間（歸還堆），這是一個概率問題。

所以，要准確有效的管理存儲資源，還是需要 GC 這樣的 “動態” 做法。

所謂 “動態”，套用一個術語， GC 建立了一個 “抽象層” 。

因為有這個 “抽象層”， GC 可以移動進程中的變量位置，而對於程序來講，沒有感覺到變化。

也正因為這樣， GC 可以有效的控制堆碎片的數量和堆表大小在一個有限的范圍。

在 C++ 里，由於 C++ 比較直接的面向 “底層”（操作系統），所以， C++ 不能提供 GC 這樣的 “抽象層”，對於堆管理，也就只能使用 “靜態”的做法，如上所述。

但到目前為止，上面說的設計解決了基本的分配和回收（包括索引機制，索引機制確保了檢索操作的時間花費在一個已知的范圍內），但還存在一個重要的問題，就是 “碎片占據 div” 的問題。就是說， div 里只要還有一個內存塊沒有歸還， div 就會被進程一直占用，不能歸還操作系統。這就導致大塊內存空間的浪費。這是一個大問題。

有網友查了資料，說 Linux 有一塊 3G 的用戶空間，進程可以使用，使用這個用戶空間不需要系統調用（不需要切換到系統進程，即不需要跨進程）。我的理解是這是操作系統提供的系統級的一個 “公共堆”，可供所有進程使用。這樣在 3G 的范圍內，進程可以共用這個公共堆，這樣可以解決 “碎片占據 div” 的問題。

所以，我說這是個重大發現。

但后來一想，這樣又有一個問題，就是地址訪問的時候不能或者難於作安全檢測了，所謂安全檢測，是指檢查訪問的地址是否越界。越界指訪問了其它進程的內存。

資料顯示，現在的安全檢測是在存儲管理部件中完成的。這是一個硬件，是 CPU 的一部分。

操作系統為存儲管理部件設置頁表，然后存儲管理部件就可以工作了。

看起來，公共堆沒有 “段” 的概念，大概很難實施判斷是否越界的安全檢查。

呀，這可怎么辦？

碎片，分為 2 個層面，

1 物理內存，頁文件

2 虛擬內存，虛擬地址

對於 1 ，操作系統可以進行整理，可以將多個頁上的零碎的數據整理到一個頁，再把虛擬地址映射到新的頁就行。這樣可以避免頻繁的載入載出頁。

對於 2 ，需要程序自己管理。比如 GC ，內存池。

但上面的說法也有一點問題，操作系統（虛擬內存）也不能整理數據層面的碎片，因為虛擬內存管理的是虛擬頁和物理頁之間的對應關系，並沒有細化到虛擬地址和物理頁之間的對應關系，所以虛擬內存也不能整理數據層面的碎片，上面說的 “將多個頁上的零碎的數據整理到一個頁” 這是不能做到的。

操作系統（虛擬內存）只能刪除空頁（沒有數據在用的頁）。

而只要頁上還有數據在用，那么，即使數據占用的空間很小，這個頁也不能被刪除。

所以，從這個角度來看，如果程序產生了很多的碎片，那么可能導致操作系統（虛擬內存）頻繁的載入載出頁。

堆在計算機系統結構里的地位等同於虛擬內存和文件系統。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 c++中共享內存原理及實現 C++ 多態的實現原理與內存模型堆（heap）——C++實現二項堆(二)之 C++的實現 c++中堆、棧內存分配 C++——堆、棧與內存管理左傾堆(二)之 C++的實現 c++關於內存釋放（棧與堆） C++中的棧內存和堆內存的區別二叉堆(二)之 C++的實現

漫談 C++ 的 內存堆 實現原理

免責聲明！

漫談 C++ 的內存堆實現原理