C++11在時空性能方面的改進
這篇我們聊聊C++11在時間和空間上的改進點;
主要包括以下方面:
新增的高效容器:array、forward_list以及unordered containers;
以及常量表達式、靜態斷言和move語義;
大小固定容器 array
std::array是一個支持隨機訪問且大小(size)固定的容器,它是c++11中新增的容器。它有如下特點:
- 不預留多余空間,只分配必須空間(譯注:size() == capacity())。
- 可以使用初始化表(initializer list)的方式進行初始化。
- 保存了自己的size信息。
- 不支持隱式指針類型轉換。
可以認為它是一個很不錯的內建數組類型。示例:
array<int,6> a = { 1, 2, 3 };
a[3]=4;
int x = a[5]; // array的默認數據元素為0,所以x的值變成0
int* p1 = a; // 錯誤: std::array不能隱式地轉換為指針
int* p2 = a.data(); // 正確,data()得到指向第一個元素的指針
可以認為array是一個緊縮版的vector,它比vector高效(沒有自動空間分配),但缺少了push_back這樣的神器,使得它的使用場景一般是用來替換c++內建的數組類型,而不是vector;
前向列表 forward_list
c++11新增的容器:前向列表 forward_list
前向列表是一個能夠在任意位置快速插入和刪除的容器(列表都這特性,前向列表當然也具有這特性),但不支持快速隨機存取。
它是用單向鏈表實現的,相比較於它的C實現而言沒有什么額外開銷。相較於std::list而言,此容器耗費的空間更少,因為它是單向的,不是雙向的。
std::forward_list<int> mylist (3,5); // 3 ints with value 5
for (int& x : mylist ) std::cout << " " << x;
哈希表[無序容器] unordered containers
hash容器在很多之前的編譯器中就包含進來了;比如gcc 較早的版本中,它存在於tr1命名空間中;
以unordered_map為例,unordered_map基於散列表實現,元素之間無序存儲;
而map基於紅黑樹實現,元素之間有序(通過operator< 進行比較);
hash版本的查找時間復雜度為O(1),在數據量很大時,比紅黑樹的版本效率高很多;
對比在C++11中和之前使用上的區別:
// c++0x中:
#include <tr1/unordered_map>
std::tr1:: unordered_map< char,int > map1;
map1.insert(std::pair<char,int>('a',100) );
// C++11中:
#include <unordered_map>
std::unordered_map< char,int > map1;
map1.insert(std::pair<char,int>('a',100) );
常量表達式 constexpr
編譯期計算(Compile-time evaluation):常量表達式
在程序中,有些計算是與運行時無關的;每次執行都是相同的結果;
常量表達式允許讓這些計算發生在編譯時,而不是在運行時;
這樣利用編譯時的計算能力,將顯著提升程序執行時的效果;
eg:對函數申明為constexpr
constexpr int multiply (int x, int y)
{
return x * y;
}
// 將在編譯時計算
const int val = multiply( 10, 10 );
cin >> x;
// 由於輸入參數x只有在運行時確定,所以以下這個不會在編譯時計算,但執行沒問題
const int val2 = mutliply(x,x);
靜態斷言 static_assert
static_assert提供一個編譯時的斷言檢查。如果斷言為真,什么也不會發生。如果斷言為假,編譯器會打印一個特殊的錯誤信息。由於是在編譯期間執行的,所以它不會影響運行時的性能;
expression在編譯期進行求值,當結果為false(即:斷言失敗)時,將string作為錯誤消息輸出。例如:
static_assert(sizeof(long) >= 8,
“64-bit code generation required for this library.”);
struct S { X m1; Y m2; };
static_assert(sizeof(S)==sizeof(X)+sizeof(Y), ”unexpected padding in S”);
static_assert在判斷代碼的編譯環境方面十分有用,比如判斷當前編譯環境是否64位。但需要注意的是,由於static_assert在編譯期進行求值,它不能對那些依賴於運行期計算的值的進行檢驗。例如:
int f(int* p, int n)
{
//錯誤:表達式“p == 0”不是一個常量表達式
static_assert(p == 0,
“p is not null”);
}
正確的做法是在運行期進行判斷,假如條件不成立則拋出異常;
下面這段代碼原本期望只做用於整數類型。
template <typename T1, typename T2>
auto add(T1 t1, T2 t2) -> decltype(t1 + t2)
{
return t1 + t2;
}
但是如果有人寫出如下代碼,編譯器並不會報錯
std::cout << add(1, 3.14) << std::endl;
std::cout << add("one", 2) << std::endl;
程序會打印出4.14和”e”。但是如果我們加上編譯時斷言,那么以上兩行將產生編譯錯誤。
template <typename T1, typename T2>
auto add(T1 t1, T2 t2) -> decltype(t1 + t2)
{
static_assert(std::is_integral<T1>::value, "Type T1 must be integral");
static_assert(std::is_integral<T2>::value, "Type T2 must be integral");
return t1 + t2;
}
error C2338: Type T2 must be integral
see reference to function template instantiation 'T2 add<int,double>(T1,T2)' being compiled
with
[
T2=double,
T1=int
]
error C2338: Type T1 must be integral
see reference to function template instantiation 'T1 add<const char*,int>(T1,T2)' being compiled
with
[
T1=const char *,
T2=int
]
move語義和右值引用
move語義和右值介紹
左值就是一個有名字的對象,而右值則是一個無名對象(臨時對象)。move語義允許修改右值(以前右值被看作是不可修改的,等同於const T&類型)。
void incr(int& a) { ++a; }
int i = 0;
incr(i); // i變為1
//錯誤:0不是一個左值
incr(0);
// 0不是左值,無法直接綁定到非const引用:int&。
// 假如可行,那么在調用時,將會產生一個值為0的臨時變量,
// 用於綁定到int&中,但這個臨時變量將在函數返回時被銷毀,
// 因而,對於它的任何更改都是沒有意義的,
// 所以編譯器拒絕將臨時變量綁定到非const引用,但對於const的引用,
// 則是可行的
”&&”表示“右值引用”。右值引用可以綁定到右值(但不能綁定到左值):
X a;
X f();
X& r1 = a; // 將r1綁定到a(一個左值)
X& r2 = f(); // 錯誤:f()的返回值是右值,無法綁定
X&& rr1 = f(); // OK:將rr1綁定到臨時變量
X&& rr2 = a; // 錯誤:不能將右值引用rr2綁定到左值a
考慮如下函數:
template<class T> swap(T& a, T& b) // 老式的swap函數
{
T tmp(a);// 現在有兩份"a"
a = b; // 現在有兩份"b"
b = tmp; // 現在有兩份tmp(值同a)
}
如果T是一個拷貝代價相當高昂的類型,例如string和vector,那么上述swap()操作也將煞費氣力;我們的初衷其實並不是為了把這些變量拷來拷去,我是僅僅想將變量a,b,tmp的值做一個“移動”(即通過tmp來交換a,b的值)。
移動賦值操作背后的思想是,“賦值”不一定要通過“拷貝”來做,還可以通過把源對象簡單地“偷換”給目標對象來實現。例如對於表達式s1=s2,我們可以不從s2逐字拷貝,而是直接讓s1“侵占”s2內部的數據存儲;
我們可以通過move()操作符來實現源對象的“移動”:
template <class T>
void swap(T& a, T& b) //“完美swap”(大多數情況下)
{
T tmp = move(a); // 變量a現在失效(譯注:內部數據被move到tmp中了)
a = move(b); // 變量b現在失效(譯注:內部數據被move到a中了,變量a現在“滿血復活”了)
b = move(tmp); // 變量tmp現在失效(譯注:內部數據被move到b中了,變量b現在“滿血復活”了)
}
move(x) 意味着“你可以把x當做一個右值”,把move()改名為rval()或許會更好,但是事到如今,move()已經使用很多年了。在C++11中,move()模板函數以及右值引用被正式引入。
將拷貝改進成移動操作,減少創建不必要的對象,節省了對象的空間分配消耗和構造析構的調用;
move對算法中的改進
基於move的std::sort()和std::set::insert()要比基於copy的對應版本快15倍以上。不過它對標准庫中已有操作的性能改善不多,因為它們的實現中已經使用了類似的方法進行優化了(例如string,vector使用了調優過的swap操作來代替copy了)。當然如果你自己的代碼中包含了move操作的話,就能自動從新標准庫中獲益了。
move對容器的改進
在C++11的標准庫中,所有的容器都提供了移動構造函數和移動賦值操作符,那些插入新元素的操作,如insert()和push_back(), 也都有了可以接受右值引用的版本。最終的結果是,在沒有用戶干預的情況下,標准容器和算法的性能都提升了,而這些都應歸功於拷貝操作的減少。
以vector為例,定義“移動構造函數(move constructors)”和“移動賦值操作符(move assignments”來“移動”而非復制它們的參數:
template<class T> class vector {
// …
vector(const vector&); // 拷貝構造函數
vector(vector&&); // 移動構造函數
vector& operator= (const vector&); // 拷貝賦值函數
vector& operator =(vector&&); // 移動賦值函數
}; //注意:移動構造函數和移動賦值操作符接受
// 非const的右值引用參數,而且通常會對傳入的右值引用參數作修改
容器新增了move版的構造和賦值函數后,它最重要的內涵就是允許我們高效的從函數中返回一個容器:
vector<int> make_random(int n)
{
vector<int> ref(n);
// 產生0-255之間的隨機數
for(auto x& : ref) x = rand_int(0,255);
return ref;
}
vector<int> v = make_random(10000);
for (auto x : make_random(1000000)) cout << x << '\n';
上邊代碼的關鍵點是vector沒有被拷貝操作(vector ref的內存空間不會在函數返回時被stack自動回收了,move assignment通過右值引用精巧的搞定了這個問題)。對比我們現在的兩種慣用法:在自由存儲區來分配vector的空間,我們得負擔上內存管理的問題了;通過參數傳進已經分配好空間的vector,我們得要寫不太美觀的代碼了。
原地安置操作 Emplace operations
在大多數情況下,push_back()使用移動構造函數(而不是拷貝構造函數)來保證它更有效率,不過在極端情況下我們可以走的更遠。為何一定要進行拷貝/移動操作?為什么不能在vector中分配好空間,然后直接在這個空間上構造我們需要的對象呢?做這種事兒的操作被叫做”原地安置”(emplace,含義是:putting in place)。
舉一個emplace_back()的例子:
vector<pair<string,int>> vp;
string s;
int i;
while(cin>>s>>i) vp.emplace_back(s,i);
emplace_back()接受了可變參數模板變量並通過它來構造所需類型。至於emplace_back()是否比push_back()更有效率,取決於它和可變參數模板的具體實現。如果你認為這是一個重要的問題,那就實際測試一下。否則,就從美感上來選擇它們吧。
參考
http://www.stroustrup.com/C++11FAQ.html
https://www.chenlq.net/books/cpp11-faq
Posted by: 大CC | 07SEP,2015
博客:blog.me115.com [訂閱]
Github:大CC
