STL中關於map和set的四個問題？

本文轉載自查看原文 2016-08-15 21:51 4641

STL map和set的使用雖不復雜，但也有一些不易理解的地方，如：

為何map和set的插入刪除效率比用其他序列容器高？

或許有得人能回答出來大概原因，但要徹底明白，還需要了解STL的底層數據結構。
C++ STL 之所以得到廣泛的贊譽，也被很多人使用，不只是提供了像vector, string, list等方便的容器，更重要的是STL封裝了許多復雜的數據結構算法和大量常用數據結構
操作。vector封裝數組，list封裝了鏈表，map和 set封裝了二叉樹等，在封裝這些數據結構的時候，STL按照程序員的使用習慣，以成員函數方式提供的常用操作，如：插入、
排序、刪除、查找等。讓用戶在 STL使用過程中，並不會感到陌生。C++ STL中標准關聯容器set, multiset, map, multimap內部采用的就是一種非常高效的平衡檢索二叉樹：
紅黑樹，也成為RB樹(Red-Black Tree)。RB樹的統計性能要好於一般的平衡二叉樹(有些書籍根據作者姓名，Adelson-Velskii和Landis，將其稱為AVL樹)，所以被STL選擇作
為了關聯容器的內部結構。本文並不會介紹詳細AVL樹和RB樹的實現以及他們的優劣，關於RB樹的詳細實現參看紅黑樹: 理論與實現(理論篇)。本文針對開始提出的幾個問題的回答
來向大家簡單介紹map和set的底層數據結構。為何map和set的插入刪除效率比用其他序列容器高？
大部分人說，很簡單，因為對於關聯容器來說，不需要做內存拷貝和內存移動。說對了，確實如此。map和set容器內所有元素都是以紅黑樹節點（如下）的方式來存儲，其節點
結構和鏈表差不多，指向父節點和子節點。結構圖可能如下：
   A
  /  \
 B    C
/ \  /  \
D E  F  G

因此插入的時候只需要稍做變換，把節點的指針指向新的節點就可以了。刪除的時候類似，稍做變換后把指向刪除節點的指針指向其他節點就OK了。這里的一切操作就是指針換來換
去，和內存移動沒有關系。

紅黑樹的節點實現：因此插入和刪除只是指針的變化：

struct __rb_tree_node_base
{
    typedef __rb_tree_color_type color_type;
    typedef __rb_tree_node_base* base_ptr;

    color_type color;  //節點顏色，非紅即黑
    base_ptr parent;   //父節點
    base_ptr left;     //左孩子
    base_ptr right;    //右孩子
}

　　2.為何每次insert之后，以前保存的iterator不會失效？

看見了上面答案的解釋，你應該已經可以很容易解釋這個問題。iterator這里就相當於指向節點的指針，內存沒有變，指向內存的指針怎么會失效呢(當然被刪除的那個元素本身已
經失效了)。相對於vector來說，每一次刪除和插入，指針都有可能失效，調用push_back在尾部插入也是如此。因為為了保證內部數據的連續存放，iterator指向的那塊內存在
刪除和插入過程中可能已經被其他內存覆蓋或者內存已經被釋放了。即使時push_back的時候，容器內部空間可能不夠，需要一塊新的更大的內存，只有把以前的內存釋放，申請新
的更大的內存，復制已有的數據元素到新的內存，最后把需要插入的元素放到最后，那么以前的內存指針自然就不可用了。特別時在和find等算法在一起使用的時候，牢記這個原
則：不要使用過期的iterator。

　　3.為何map和set不能像vector一樣有個reserve函數來預分配數據？

我以前也這么問，究其原理來說時，引起它的原因在於在map和set內部存儲的已經不是元素本身了，而是包含元素的節點。也就是說map內部使用的Alloc並不是
map<Key, Data, Compare, Alloc>聲明的時候從參數中傳入的Alloc。例如：

map<int, int, less<int>, Alloc<int> > intmap;

這時候在intmap中使用的allocator並不是Alloc<int>, 而是通過了轉換的Alloc，具體轉換的方法時在內部通過Alloc<int>::rebind重新定義了新的節點分配器，詳細的實現
參看徹底學習STL中的Allocator。其實你就記住一點，在map和set內面的分配器已經發生了變化，reserve方法你就不要奢望了。

　　4.當數據元素增多時（10000到20000個比較），map和set的插入和搜索速度變化如何？

如果你知道log2的關系你應該就徹底了解這個答案。在map和set中查找是使用二分查找，也就是說，如果有16個元素，最多需要比較4次就能找到結果，有32個元素，最多比較5次
。那么有10000個呢？最多比較的次數為log10000，最多為14次，如果是20000個元素呢？最多不過15次。看見了吧，當數據量增大一倍的時候，搜索次數只不過多了1次，多了1/1
4的搜索時間而已。你明白這個道理后，就可以安心往里面放入元素了。最后，對於map和set Winter還要提的就是它們和一個c語言包裝庫的效率比較。在許多unix和linux平台下
，都有一個庫叫isc，里面就提供類似於以下聲明的函數:

void tree_init(void **tree);
void *tree_srch(void **tree, int (*compare)(), void *data);
void tree_add(void **tree, int (*compare)(), void *data, void (*del_uar)());
int tree_delete(void **tree, int (*compare)(), void *data,void (*del_uar)());
int tree_trav(void **tree, int (*trav_uar)());
void tree_mung(void **tree, void (*del_uar)());

許多人認為直接使用這些函數會比STL map速度快，因為STL map中使用了許多模板什么的。其實不然，它們的區別並不在於算法，而在於內存碎片。如果直接使用這些函數，你需
要自ma己去new一些節點，當節點特別多，而且進行頻繁的刪除和插入的時候，內存碎片就會存在，而STL采用自己的Allocator分配內存，以內存池的方式來管理這些內存，會大
大減少內存碎片，從而會提升系統的整體性能。Winter在自己的系統中做過測試，把以前所有直接用isc函數的代碼替換成map，程序速度基本一致。當時間運行很長時間后（例如
后台服務程序），map的優勢就會體現出來。從另外一個方面講，使用map會大大降低你的編碼難度，同時增加程序的可讀性。何樂而不為？

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 STL map、set中key為結構體的用法 STL中set的用法 STL之hash_set和hash_map c++之STL模板，set與map Java集合框架的四個接口 collection list set map JS中的Map和Set STL中的map、unordered_map、hash_map stl map STL中的map容器的一點總結 C++ STL中Map的按Value排序