提升vector性能的幾個技巧

本文轉載自查看原文 2018-07-04 21:15 6695 轉載/ 面試/ 數據結構和算法

原文：https://www.sohu.com/a/120595688_465979

Vector 就像是 C++ STL 容器的瑞士軍刀。Bjarne Stoutsoup 有一句話 – “一般情況下，如果你需要容器，就用 vector”。像我們這樣的普通人把這句話當作真理，只需要照樣去做。然而，就像其它工具一樣，vector 也只是個工具，它能提高效率，也能降低效率。

這篇文章中我們可以看到 6 種優化使用 vector 的方法。我們會在最常見的使用 vector 的開發任務中看到有效的方法和無效的方法，並以此衡量有效使用 vector 會帶來怎樣的性能提升，並試圖理解為什么能得到這樣的性能提升。

性能測試的搭建和方法:

所有測試都在我的 Surface Book 中運行，這台筆記本擁有主頻 2.6Ghz 的酷睿 i7 處理器，8 GB 內存，安裝了 Windows 10 操作系統並使用 VS2015 C++ 編譯器編譯運行。
我們會使用 Stopwatch。這個工具由 Kjell 創建，在可以找到。
我們會運行每個測試 100 次，然后計算平均運行時間來作為依據。運行測試的代碼在。你可以自由下載，用於在你自己的系統中評估 vector 的性能。那里提供的代碼段只反映了一次循環，這讓事件變得簡單。
我們在 vector 中存入 TestStruct 結構的數據，並使用 FillVector() 來填充 vector。它們的定義如下。

馬上開始在 C++ 11 中優化 vector 用法的介紹。

#1 提前分配足夠的空間以避免不必要的重新分配和復制周期

程序員喜歡使用 vector，因為他們只需要往向容器中添加元素，而不用事先操心容器大小的問題。但是，如果由一個容量為 0 的 vector 開始，往里面添加元素會花費大量的運行性能。如果你之前就知道 vector 需要保存多少元素，就應該提前為其分配足夠的空間。

這里有一個簡單的示例，往 vector 里添加 1 萬個測試結構的實例——先進行不預分配空間的測試再進行有預分配的測試。

在我的計算機中，未預分配空間的情況用了 5145 微秒(us)，而預分配了空間的情況下只用了 1279 微秒，性能提高了 75.14%！！！

這個情況在 Scott Meyers 的書中得到了很好的解釋，這本書叫 :

“對於 vector 和 string，在需要更多空間的時候，會做與 realloc 等效的事情。這種類似 realloc 的操作有4個步驟：

1. 分別一個新的內存塊，其容量是容器當前容量的數倍。多數實現中，vector 和 string 容量的提升因子在 1.5 和 2 之間。

2. 從容器原來占用的內存中將元素拷貝到新分配的內存中。

3. 釋放原有內存中的對象。

4. 釋放原有內存。

有了所有這些操作：分配、回收、拷貝和釋放，如果說這些步驟（對於性能）極其昂貴，你一點都不應該感到驚訝。當然，你肯定不希望頻繁的進行這樣的操作。如果這還沒有打動你，那么想想每次進行這些步驟的時候，vector 和 string 中所有的迭代器、指針和引用都會失效。這意味着一個簡單的插入操作，對於其它使用了當前 vector 或 string 中的迭代器、指針或引用的數據結構，都有可能引起對它們進行更新。”

2.使用 shrink_to_fit() 釋放 vector 占用的內存， – clear() 或 erase() 不會釋放內存。

與大家所想的相反，使用 erase() 或 clear() 從 vector 中刪除元素並不會釋放分配給 vector 的內存。做個簡單的實驗就可以證明這一點。我們往一個 vector 中添加 100 個元素，然后在這個 vector 上調用 clear() 和 erase()。然后我們可以讓 capacity() 函數告訴我們為這個容器分配的內存可以存入多少元素。