原文鏈接
http://marknelson.us/2014/09/11/highlights-of-iso-c14/
下面是對你的日常開發有重大影響的C++14新變動,列出了一些示例代碼,並討論何時以及為什么要使用它們。
1. 返回值類型推導(Return type deduction)
對auto做進一步的闡述是很有趣的事情。C++仍然是類型安全的,但是類型安全機制越來越多的由編譯器來執行,而非程序員自己。
在C++11中,程序員已經開始使用auto來進行聲明了。當使用全限定類型名稱(fully qualified type name )會讓你感到吃驚時(因為太長了),例如,創建迭代器,這時候你會感激auto的出現。新發明的C++代碼更加易讀:
1 for ( auto ii = collection.begin() ; ...
上面的代碼仍然是類型安全的——編譯器知道begin()在其所在的上下文中會返回什么類型,因此關於類型ii是什么就不再有問題了,並且對每個使用auto的地方都會進行檢查。
在C++ 14中,auto的使用在幾個方面進行了擴展。一個非常有意義的地方是返回類型推導(return type deduction)。如果我在函數內部寫下這樣一行代碼:
1 return 1.4;
編譯器和我都清楚的知道函數的返回值是double。所以在C++14中,我可以將函數返回類型定義為auto而不是double:
1 auto getvalue() {
這個新特性的細節非常容易被理解。舉個例子,如果一個函數有多個返回值,它們需要有相同的類型。代碼如下:
1 auto f(int i) 2 { 3 if ( i < 0 ) 4 return -1; 5 else 6 return 2.0 7 }
看上去應該將返回類型推導為double,但是標准會禁止這種模棱兩可的行為,編譯器會發出抱怨:
error_01.cpp:6:5: error: 'auto' in return type deduced as 'double' here but deduced as 'int' in
earlier return statement
return 2.0
^
1 error generated.
為什么返回類型推導對於C++程序來說是錦上添花的。首先,有時候你必須返回一個非常復雜的類型,比如在對標准庫容器進行搜索的時候返回一個迭代器。auto返回類型使得函數更加易讀,易寫。其次,這個原因可能不是那么明顯,使用auto返回類型能夠增強你的重構能力。舉個例子,考慮下面的代碼:
1 #include <iostream> 2 #include <vector> 3 #include <string> 4 5 struct record { 6 std::string name; 7 int id; 8 }; 9 10 auto find_id(const std::vector<record> &people, 11 const std::string &name) 12 { 13 auto match_name = [&name](const record& r) -> bool { 14 return r.name == name; 15 }; 16 auto ii = find_if(people.begin(), people.end(), match_name ); 17 if (ii == people.end()) 18 return -1; 19 else 20 return ii->id; 21 } 22 23 int main() 24 { 25 std::vector<record> roster = { {"mark",1}, 26 {"bill",2}, 27 {"ted",3}}; 28 std::cout << find_id(roster,"bill") << "\n"; 29 std::cout << find_id(roster,"ron") << "\n"; 30 }
在這個例子中,使find_id返回auto比返回int並沒有使我節省多少腦力。但是考慮一下,如果我決定重構record結構體,會發生生么。這次我不在record對象中使用一個整型來唯一標記一個人了,而是使用一個新的GUID類型:
1 struct record { 2 std::string name; 3 GUID id; 4 };
對record對象所做的這個改變會導致一系列的連鎖反應,比如函數的返回類型會發生變化。但是如果我對函數返回值使用自動類型推導,編譯器會默默的應對這些變化。任何在大型工程上進行開發的C++程序員都會熟悉這個問題。對單一數據結構的修改會導致無休止的對原代碼的迭代,對變量,參數以及返回類型的修改。auto的廣泛使用能夠消減很大一部分這樣的工作。
注意:在上面的例子和剩下的章節中,我會創建和使用命名的lambda.我猜測大多數用戶在使用類似std::find_if()的lambdas函數時,都會將其定義為匿名inline對象,這是非常便利的使用方式。鑒於頁面寬度有限,我認為命名lambda在你的瀏覽器中更加易讀。
所以這種寫法你不必特地的模仿,僅僅是更加易讀而已。特別在你沒有lambda經驗的情況下,讀起來會簡單些。
使用auto作為返回值的立竿見影的效果是reality of it's doppelganger, decltype(auto),還有有了類型推導的規則。現在你可以使用它來自動獲取類型信息了,如下面的代碼片段:
1 template<typename Container> 2 struct finder { 3 static decltype(Container::find) finder1 = Container::find; 4 static decltype(auto) finder2 = Container::find; 5 };
2. 泛型lambdas
另外一個auto悄悄潛伏的地方是在lambda參數的定義中。使用auto類型聲明定義lambda參數同創建模板函數基本相當。lambda會基於參數推導類型來進行特定的實例化。
這對創建可在不同上下文中重用的lambdas來說是很方便的。在下面的簡單例子中,我創建了一個lambdas用做標准庫函數的謂詞(predicate)。在C++11的世界里,我分別為整型加法,字符串加法顯示的實例化了一個lambda。
有了泛型lambda,我能用其定義單一的lambda。雖然它的語法不包括關鍵字template,這仍然是對C++泛型編程的進一步擴展:
1 #include <iostream> 2 #include <vector> 3 #include <string> 4 #include <numeric> 5 6 int main() 7 { 8 std::vector<int> ivec = { 1, 2, 3, 4}; 9 std::vector<std::string> svec = { "red", 10 "green", 11 "blue" }; 12 auto adder = [](auto op1, auto op2){ return op1 + op2; }; 13 std::cout << "int result : " 14 << std::accumulate(ivec.begin(), 15 ivec.end(), 16 0, 17 adder ) 18 << "\n"; 19 std::cout << "string result : " 20 << std::accumulate(svec.begin(), 21 svec.end(), 22 std::string(""), 23 adder ) 24 << "\n"; 25 return 0; 26 }
產生如下結果:
int result : 10
string result : redgreenblue
即使你對匿名inline lambdas進行實例化,正如如前面討論的,泛型參數仍然是有用的。當你的數據結構發生了變化或者APIs中的函數被修改了,對泛型lambdas進行調整時只需要重新編譯就可以了,不需要重新實現:
1 std::cout << "string result : " 2 << std::accumulate(svec.begin(), 3 svec.end(), 4 std::string(""), 5 [](auto op1,auto op2){ return op1+op2; } ) 6 << "\n";
3. 被初始化的lambdas捕獲(Initialized lambda captures)
在C++11中我們必須開始適應lambda捕獲特化(lambda capture specification)的概念。這種聲明會在創建閉包(closure)的時候對編譯器進行引導:lambda定義了一個函數的實例,還有定義在lambda作用域之外的綁定在函數上的變量。
在早期的推導返回類型的例子中,我實現了捕獲單個變量名字的一個lambda定義,用做謂詞中搜索字符串的源:
1 auto match_name = [&name](const record& r) -> bool { 2 return r.name == name; 3 }; 4 auto ii = find_if(people.begin(), people.end(), match_name );
這種特殊的捕獲使lambda獲取了按引用訪問變量的權限。捕獲也能按值來執行,在兩種情況中,變量的使用方式都會符合C++的直覺。按值捕獲意味着lambda在本地變量的拷貝上進行操作,按引用捕獲意味着lambda在外圍作用域的變量本身進行操作。
這些都很好,但也會有伴隨而來的一些局限性。我想委員會感覺需要處理的一件事情是使用move-only語義來初始化捕獲變量。
這意味着什么?如果我們認為lambda即將成為參數的接收器,我們想使用move語義捕獲外部變量。舉個例子,考慮如何使lambda接收一個move-only unique_ptr參數。第一個嘗試是按值捕獲,失敗了:
1 std::unique_ptr<int> p(new int); 2 *p = 11; 3 auto y = [p]() { std::cout << "inside: " << *p << "\n";};
這會生成一個編譯錯誤因為unique_ptr沒有拷貝構造函數——它所想的就是禁止拷貝。
將其改為按引用捕獲就能編譯通過,但是沒有達到預期效果:也就是通過將值move到本地的拷貝來接收參數。最后你可以通過先創建本地變量然后在捕獲的引用上調用std::move()來完成,但是效率不高。
通過對捕獲語句語法進行修改可以修復這個問題。現在我們不是只聲明一個捕獲變量,我們也能對其初始化。看下面的例子:
1 auto y = [&r = x, x = x+1]()->int {...}
上面的代碼捕獲了x的拷貝,同時為x增加了1。這個例子很容易理解,但是我不確定它是否為接收move-only變量捕獲了這種新語法的值。使用這個新語法的例子如下:
1 #include <memory> 2 #include <iostream> 3 4 int main() 5 { 6 std::unique_ptr<int> p(new int); 7 int x = 5; 8 *p = 11; 9 auto y = [p=std::move(p)]() { std::cout << "inside: " << *p << "\n";}; 10 y(); 11 std::cout << "outside: " << *p << "\n"; 12 return 0; 13 }
在這個例子中,捕獲的值p用move語義來初始化,在沒有聲明本地變量的情況下有效的接收了指針:
inside: 11
Segmentation fault (core dumped)
這個令人討厭的結果正是你想要的——在p被捕獲並且move到lambda中后,代碼對p進行了解引用。
4. [[棄用的]][[deprecated]]屬性
初次看到deprecated 屬性是在java中,我承認有點嫉妒。對大多數程序員來說代碼腐爛(rot)是一個巨大的問題。(曾經鼓勵刪除代碼?但我從來沒有這么做過)。這個新屬性提供了攻克這個問題的系統級別的方法。
用起來很簡單,將標簽【[[deprecated]]放在聲明之前就可以了,聲明可以為類,變量,函數或其他東西。結果像下面這個樣子:
1 class 2 [[deprecated]] flaky { 3 };
當你的程序使用了一個deprecated實體,原本需要編譯器做出反應,現在留給了代碼實現者。很清楚大多數人希望能夠看到某種警告,也能隨手把這種warning關掉。舉個例子,clang3.4在實例化一個deprecated類的時候會發出以下警告:
dep.cpp:14:3: warning: 'flaky' is deprecated [-Wdeprecated-declarations]
flaky f;
^
dep.cpp:3:1: note: 'flaky' declared here
flaky {
^
C++的屬性標記語法看上去有點不熟悉。在屬性列表中,[[deprecated]]被放在關鍵字(如class 或者enum)之后,實體名字之前。
這個標記有另外一種形式,它包含了一個信息參數。由開發人員決定如何寫這個信息。clang3.4忽略了這個信息。
看下面的代碼片段
1 class 2 [[deprecated]] flaky { 3 }; 4 5 [[deprecated("Consider using something other than cranky")]] 6 int cranky() 7 { 8 return 0; 9 } 10 11 int main() 12 { 13 flaky f; 14 return cranky(); 15 }
它並沒有包含error信息:
dep.cpp:14:10: warning: 'cranky' is deprecated [-Wdeprecated-declarations]
return cranky();
^
dep.cpp:6:5: note: 'cranky' declared here
int cranky()
^
5. 二進制數字和數字分隔符
有兩個新功能不是驚天動地的,但他們確實代表了很好的句法結構的改善。這樣的很小的改變改善了代碼可讀性,進一步減少了bug數量。C++ 程序員現在可以創建一個二進制數字,向已經包含十進制,十六進制以及很少使用的八進制的標准中又添加了一員。二進制數字使用前綴0b后面緊接數字。在美國和英國,我們使用逗號來作為數字分隔符,如:$1,000,000。這種寫法真正方便了讀者,使得我們的大腦處理很長的數字時更加容易。因為同樣的原因C++標准委員會添加了數字分隔符。它們不影響數值,只是通過分塊讓數字的讀寫更加容易。
數字分隔符使用什么字符?在C++中基本上每個標點符號都被特定的特性使用了,因此沒有很明顯的選擇。最后的選擇是使用單引號字符,使得C++的百萬數表示如下:1'000'000.00。記住分隔符對數值沒有任何影響,因此百萬數也可表示如下:1'0'00'0'00.00。
下面的例子使用了兩個新特性:
1 #include <iostream> 2 3 int main() 4 { 5 int val = 0b11110000; 6 std::cout << "Output mask: " 7 << 0b1000'0001'1000'0000 8 << "\n"; 9 std::cout << "Proposed salary: $" 10 << 300'000.00 11 << "\n"; 12 return 0; 13 }
結果也是你所意料的:
Output mask: 33152
Proposed salary: $300000
6. 剩余特性
c++的其他新特性無需多述。變量模板在變量上對模板的擴展。總會使用到的例子是變量pi<T>的一個實現。當實現為double的時候,變量會返回3.14,當實現為int時,它可能返回3,當實現為string時,可能返回“3.14”或者"pi",這是個很棒的特性,以前是在<limits>中實現的。變量模板的語法和語義和類模板是基本相同的——你無需額外的學習就能使用它們。對constexpr函數的限制放松了,例如,可以有多個返回值,可以在內部使用case和if語句,可以用循環以及其它。這就對能在編譯器做的事進行了擴展,為模板的引入插上了翅膀。其他小的特性包括為內存分配指定大小(sized deallocations)和一些語法的整理(tidying)。
7. 下一步做啥?
通過對語言進行改善來保持語言的流行,C++委員會感覺到了壓力,它們已經為另外一個標准進行准備了,也就是C++17。
可能更加有趣的事情是創立一些小組,這些小組可以創建技術規格和文檔,雖然不會達到標准的水平,但是會被ISO委員會發布和支持。大概這會更加快速的執行。委員會當前致力於8個部分,包括:
- 文件系統
- 並發(Concurrency)
- 並行(Parallelism)
- 網絡
- 概念(Concepts )
這些技術規格的成功與否必須由是否被采納和使用來評判。如果我們發現所有實現都使用了這些規格,那么為這個規格建立的新軌道就算成功了。
C/C++一致保持着很好的使用度。現代C++,我們從C++11開始算起,在語言易用性和沒有損害性能前提下的安全性有了長足的進步。對於特定類型的工作,很難有理由來將C或者C++替換掉。C++14標准並不像C++11跳躍度這樣大,但是它使語言在一個很好的方向上。如果標准委員會在接下來的10年能夠在生產率上維持當前的水准,在以性能為導向的應用中C++應該會繼續成為被選擇的語言。
