C++起源:
與C語言一樣,C++也是在貝爾實驗室誕生的,Bjarne Stroustrup於20世紀80年代在這里開發出了這種語言。Stroustrup比較關系的是讓C++更有用,而不是實施特定的編程原理和風格。名稱C++來自C語言的遞增運算符++,名稱C++表示它是C的擴充版本。
C++ 作者
C++是80年代由貝爾實驗室的Bjarne Stroustrup博士及其同事在C語言的基礎上開發成功的面向對象(oop)的語言。
C++發展:
C++是一門以C為基礎發展而來的一門面向對象的高級程序設計語言,從1983年在貝爾實驗室創立開始至今,已有30多個年頭。C++從最初的C with class,經歷了從C++98、C++ 03、C++ 11、C++ 14再到C++17多次標准化改造,功能得到了極大的豐富,已經演變為一門集面向過程、面向對象、函數式、泛型和元編程等多種編程范式的復雜編程語言。由於C++過於復雜,並且經歷了長時間的發展演變,目前對於C++標准支持的較好主要有GNU C++和Visual C++,嚴格來說,目前還沒有一個完全支持ISO C++的版本。
C++實現 源代碼文件的擴展名
UNIX C、cc、cxx、c
GNU C++ C、cc、cxx、cpp、c++
Digital Mars cpp、cxx
Borland C++ cpp
Watcom cpp
Microsof t Visual C++ cpp、cxx、cc
Freestyle Code Warrior cp、cpp、cc、cxx、c++
什么是C++
C++是一種使用廣泛的計算機程序設計語言。它是一種通用程序設計語言,支持多重編程模式,例如過程化程序設計、數據抽象、面向對象程序設計、泛型程序設計和設計模式等。
比雅尼·斯特勞斯特魯普博士在貝爾實驗室工作期間在20世紀80年代發明並實現了C++。起初,這種語言被稱作“C with Classes”(“包含‘類’的C語言”),作為C語言的增強版出現。隨后,C++不斷增加新特性。虛函數(virtual function)、運算符重載(operator overloading)、多繼承(multiple inheritance)、標准模板庫(standard template library, STL)、異常處理(exception)、運行時類型信息(Runtime type information)、名字空間(namespace)等概念逐漸納入標准。1998年,國際標准組織(ISO)頒布了C++程序設計語言的第一個國際標准ISO/IEC 14882:1998,當前最新標准為ISO/IEC 14882:2017。根據《C++編程思想》(Thinking in C++)一書,C++與C的代碼執行效率往往相差在±5%之間。
C++語言發展大概可以分為三個階段:第一階段從80年代到1995年。這一階段C++語言基本上是傳統類型上的面向對象語言,並且憑借着接近C語言的效率,在工業界使用的開發語言中占據了相當大份額;第二階段從1995年到2000年,這一階段由於標准模板庫(STL)和后來的Boost等程序庫的出現,泛型程序設計在C++中占據了越來越多的比重。當然,同時由於Java、C#等語言的出現和硬件價格的大規模下降,C++受到了一定的沖擊;第三階段從2000年至今,由於以Loki、MPL(Boost)等程序庫為代表的產生式編程和模板元編程的出現,C++出現了發展歷史上又一個新的高峰,這些新技術的出現以及和原有技術的融合,使C++已經成為當今主流程序設計語言中最復雜的一員。
發展歷史
比雅尼·斯特勞斯特魯普,C++之父
比雅尼·斯特勞斯特魯普(Stroustrup)工作起於1979年的C with Classes。[1]這個構思起源於斯特勞斯特魯普做博士論文時的一些程序撰寫經驗。他發現Simula具備很利於大型軟件開發的特點,但Simula的運行速度太慢,無法對現實需求發揮功效;BCPL雖快得多,但它過於低級的特性,使其不適於大型軟件的開發。當斯特勞斯特魯普開始在貝爾實驗室工作時,他有分析UNIX核心關於分布式計算的問題。回想起他的博士論文經驗,斯特勞斯特魯普開始為C語言增強一些類似Simula的特點。[2]之所以選擇C,是因為它適於各種用途、快速和可移植性。除了C和Simula之外,同時也從其它語言中獲取靈感,如ALGOL 68、Ada、CLU以及ML。
剛開始時,類別、派生類、存儲類型檢查、內聯和缺省參數特性,都是透過Cfront引入C語言之中。[3]
1983年,C with Classes改命名為C++(++是C語言中的增值操作符)。加入了新的特性,其中包括虛函數、函數名和運算符重載、參考、常量、用戶可控制的自由空間存儲區控制、改良的類型檢查,以及新的雙斜線(//)單行注解風格。
1985年,發布第一版《C++程序設計語言》,提供一個重點的語言參考,至此還不是官方標准。[4]1985年10月出現了第一個商業化發布。
1989年,發布了Release 2.0。引入了多重繼承、抽象類別、靜態成員函數、常量成員函數,以及成員保護。1990年,出版了The Annotated C++ Reference Manual。這本書后來成為標准化的基礎。稍后還引入了模板、異常處理、名字空間、新的強制類型轉換,以及布爾類型。
隨着C++語言的演變,也逐漸演化出相應的標准程序庫。最先加進C++標准庫的是流I/O程序庫,其用以取代傳統的C函數,如printf和scanf。隨后所引入的程序庫中最重要的便是標准模板庫,簡稱STL。
多年后,一個聯合的ANSI-ISO委員會於1998年對C++標准化(ISO/IEC 14882:1998)。在官方發布1998標准的若干年后,委員會處理缺陷報告,並於2003年發布一個C++標准的修正版本。2005年,一份名為Library Technical Report 1(簡稱TR1)的技術報告發布。雖然還不是官方標准的一部分,不過它所提供的幾個擴展可望成為下一版C++標准的一部分。幾乎所有當前仍在維護的C++編譯器皆已支持TR1。
當前最新的C++標准是2017年12月發布的ISO/IEC 14882:2017[5],又稱C++17或C++1z。
雖然C++免專利,但標准文件本身並不是免費的,盡管標准文檔不是免費的,但是很容易從網絡中獲取,最簡單的就是C++標准文檔之前的最后一次草稿版本,它與標准的差別幾乎只在於排版上。
C++名字的由來
C++這個名字是Rick Mascitti於1983年中所建議的,並於1983年12月首次使用。更早以前,尚在研究階段的發展中語言曾被稱為“new C”,之后是“C with Classes”。在計算機科學中,C++仍被稱為C語言的上層結構。它最后得名於C語言中的“++”運算符(其對變量的值進行遞增)。而且在共同的命名約定中,使用“+”以表示增強的程序。斯特勞斯特魯普說:“這個名字象征着源自於C語言變化的自然演進”。C+是一個和C/C++無關的早期編程語言。
Rick Mascitti在1992年被非正式地問起名字的由來,他表示這是在半開玩笑中說出的。他從沒想過C++會成為這門語言的正式名字。
有一個關於C++名字的笑話是,當你使用后綴++時,附加只發生在運算之后(因此,它應該是++C,而不是C++,這個笑話是說時下某些程序員還在以使用C的方式使用C++,這通常被一些權威著作認為是不正確的)。
標准程序庫
1998的C++標准分為兩個部分:核心語言和C++標准程序庫;后者包含了大部分標准模板庫和C標准程序庫的稍加修改版本。存在許多不屬於標准部分的C++程序庫,且使用外部鏈接,程序庫甚至可以用C撰寫。
C++標准程序庫充分吸收了C標准程序庫,並佐以少許的修改,使其與C++良好的運作。另一個大型的程序庫部分,是以標准模板庫(STL)為基礎,STL於1994年2月正式成為ANSI/ISO C++。它提供了實用的工具,如容器類(如:Array和Vector),迭代器(廣義指針)提供容器以類似數組的訪問方式,以及泛型算法進行搜索和排序的運算。此外還提供了(multi)map和(multi)set,它們都共享相似的成員函數。因此,以下成為可能,使用模板撰寫泛型算法,它可以和任何容器或在任何以迭代器定義的序列上運作。如同C,使用#include指令包含標准表頭,即可訪問程序庫里的功能。C++提供69個標准表頭,其中19個不再贊成使用。
使用標准模板庫(例如:使用std::vector或std::string來取代C風格的數組或字符數組)有助於導向更安全和更靈活的軟件。
在STL在納入C++標准以前,是來自HP和后來的SGI的第三方程式庫,標准中並未稱之為“STL”,它只是標准庫中的一部分,但仍有許多人使用這個名稱,以別於其它的標准庫(輸入/輸出流、國際化、診斷、C程序庫子集,等等)。 另外,如std::basic_string此類標准委員會添加的接口,有時也被誤認為STL;實際上它們並不存在於原始的SGI STL中,在標准化后SGI STL才從標准庫吸收加入其中。
C++中的特色
和C語言相比,C++引入了更多的特性,包括:復合類型(引用類型等)、const限定符和constexpr常量表達式、類型處理運算符(類型別名及auto和decltype等多種類型指示符)、C++標准庫(IO庫與多種容器類)與迭代器、動態內存與智能指針、函數重載、面向對象程序設計(如數據抽象、成員函數、類作用域、構造函數與析構函數、靜態成員、訪問控制與繼承、虛函數、抽象類與接口等)、拷貝控制、運算符重載、造型與函數風格的強制類型轉換、模板與泛型編程,以及異常處理、名字空間、多繼承與虛繼承、運行時類型識別及嵌套類等。
和普遍認為的相反,C++不是第一個正式引入const關鍵字的語言。80年代早期,Bjarne Stroustrup和Dennis Retchie討論之后提供了在C語言中readonly/writeonly的實現機制,並在帶類別的C中獲取了一定經驗。關鍵字const正式引入C語言是在ANSI C89。這早於第一個C++國際標准近十年,但此時const已被C++實現普遍采用。
以“//”起始作為注解起源自C的前身BCPL,而后被重新引入到C++。
C++的一些特性,C不久之后也采用了,包括在for循環的括號中聲明,C++風格的注解(使用//符號,和inline,雖然C99定義的inline關鍵字與C++的定義不兼容。不過,C99也引入了不存在於C++的特性,如:可變參數宏,和以數組作為參數的較佳處理;某些C++編譯器可能實現若干特性,以作為擴展,但其余部分並不匹配現存的C++特性)
一個常見的混淆其實只是一個微妙的術語問題:由於它的演化來自C,在C++中的術語對象和C語言一樣是意味着存儲器區域,而不是類的實體,在其它絕大多數的面向對象語言也是如此。舉例來說,在C和C++中,語句int i;定義一個int類型的對象,這就是變量的值i將在指派時,所存入的存儲器區域。
與C不兼容之處
大部分的C代碼可以很輕易的在C++中正確編譯,但仍有少數差異,導致某些有效的C代碼在C++中失效,或者在C++中有不同的行為。
最常見的差異之一是,C允許從void*隱式轉換到其它的指標類型,但C++不允許。下列是有效的C代碼:
C++有時被認為是C的超集(superset),但這並不嚴謹。
各個版本的ISO/IEC 14882的附錄C中都指出了C++和ISO C的一些不兼容之處。
大部分的C代碼可以很輕易的在C++中正確編譯,但仍有少數差異,導致某些有效的C代碼在C++中失效,或者在C++中有不同的行為。
最常見的差異之一是,C允許從void*隱式轉換到其它的指標類型,但C++不允許。下列是有效的C代碼:
// 從void *隱式轉換為int *
int *i = malloc(sizeof(int) * 5);
但要使其在C和C++兩者皆能運作,就需要使用顯式轉換:
int *i = (int *)malloc(sizeof(int) * 5);
1
2
3
4
5
6
7
由於C++函數和C函數通常具有不同的名字修飾和調用約定,所有在C++中調用的C函數,須放在extern “C” { /* C函數聲明 */ }之內。
但要使其在C和C++兩者皆能運作,就需要使用顯式轉換:
int *i = (int *)malloc(sizeof(int) * 5);
1
另一個常見的可移植問題是,C++定義了很多的新關鍵字,如new和class,它們在C程序中,是可以作為識別字(例:變量名)的。
C99去除了一些不兼容之處,也新增了一些C++的特性,如//注釋,以及在代碼中混合使用。不過C99也納入幾個和C++沖突的新特性(如:可變長數組、原生復數類型和復合逐字常數),而C++11已經加入了兼容C99預處理器的特性。
由於C++函數和C函數通常具有不同的名字修飾和調用約定,所有在C++中調用的C函數,須放在extern “C” { /* C函數聲明 */ }之內。
預處理器
C++主要有三個編譯階段:預處理、轉譯成目標代碼和鏈接(最后的兩個階段一般才視為真正的“編譯”)。在第一階段,預處理,會將預處理器指令替換成源代碼,然后送到下一個編譯階段。
預處理器指令和
預處理指令的運作方式是根據用戶定義的規則,簡單的把記號字符序列置換成其它的記號字符序列。它們進行宏置換、含入其它的文件(由底層至高端的特性,例如包含模塊/包/單元/組件)、條件式編譯和條件式含入。例如:
#define PI 3.1415926535897932384626433832795028841971693993751
1
原始代碼中出現的PI,都將會替換為3.1415926535897932384626433832795028841971693993751。另一個普遍的例子是
#include <iostream>
1
它將標准庫頭文件iostream中所有的聲明語句都納入調用者所在的程序塊。除了以上提到的常用指令以外,還有幾個額外的預處理器指令,可以用來控制編譯流程、條件式含入或排除代碼區塊等等。
模板
模板(Template)指C++編程語言中的函數模板(function template)與類別模板(class template),這種觀念是取材自Simula的泛型程序設計。它采用typename和class兩個關鍵字,來標識模板類別的類型參數。C++11和C++14分別引入了類型別名模板和變量模板。
類別與對象
在面向對象對象程序設計術語中,對象(object)是數據(data)和處理數據的指令(instructions)的聯合(association)。模擬(simulate)實際世界(real-world),對象有三種特質(characteristics):狀態(State)、行為(Behavior)、同一性身份,並且使用消息(message)來引發彼此的交互。類別(class)為對象的藍圖或工廠,定義了對象的抽象特質,包括對象的屬性特質和對象的行為特質,屬性的值即是對象的狀態,行為即是對象能夠做的事。
C++為類別構成式面向對象編程語言(class-based object-oriented programming language),類別概念具現化(reification)地作為二等公民(second-class citizen)出現在C++語言當中,在語法中明確地使用類別來做到數據抽象、封裝、模塊化、繼承、子類型多態、對象狀態的自動初始化。C++中,一個類別即為一個類型,加上封裝,一個類別即為一個抽象數據類型(Abstract Data Type,ADT),繼承、多態、模板都加強了類別的可抽象性。在C++可以使用class或struct這兩個關鍵字宣告類別(class),而使用new運算符實體化類別產生的實體(instance)即為對象,是一等公民。C/C++以數據成員(data member)表達屬性,以成員函數(member function)表達行為。
聲明一個Car class:
1 class Car {
2 private:
3 int isRunning;
4 public:
5 Run();
6 };
1
2
3
4
5
6
但是仍然需要注意,嚴格來說,C++中對象的概念和C的對應概念接近,表示的是具有特定類型的存儲,而非面向對象意義上的“對象”:一個對象不一定是類類型的。此外,C++意義上的“實例”僅指模板實例化的結果,而並不指對象。作為對比,Java的“對象”和“實例”的概念和這里的使用一致。
封裝
封裝(Encapsulation)是將數據和處理數據的程序(procedure)組合起來,僅對外公開接口(interface),達到信息隱藏(information hiding)的功能。封裝的優點是能減少耦合(Coupling)。C++、Java、C# 等語言定義對象都是在語法中明確地使用類別(Class)來做到封裝。
C++的類對其成員(包括數據成員、函數成員)分為三種封裝狀態:
公有(public):類別的用戶可以訪問、使用該類別的此種成員。
保護(protected):該類別的派生類可以訪問、使用該類別的此成員。外部程序代碼不可以訪問、使用這種成員。
私有(private):只有類別自身的成員函數可以訪問、使用該類別的此成員。
一般可以將C++類的對外接口設定為公有成員;類內部使用的數據、函數設定為私有成員;供派生自該類別的子類使用的數據、函數設定為保護成員。
繼承
繼承(Inheritance)是指派生類(subclass)繼承基類(superclass),會自動獲取超類別除私有特質外的全部特質,同一類別的所有實體都會自動有該類別的全部特質,做到代碼再用(reuse)。C++只支持類別構成式繼承,雖然同一類別的所有實體都有該類別的全部特質,但是實體能夠共享的實體成員只限成員函數,類別的任何實體數據成員乃每個實體獨立一份,因此對象間並不能共享狀態,除非特質為參考類型的屬性,或使用指針來間接共享。C++支持的繼承關系為:
公有繼承(public inheritance):最常用繼承關系,含義是“is-a”關系,代表了在完全使用公有繼承的對象類別之間的層次關系(hierarchy)。
受保護繼承(protected inheritance):基類的公有或保護內容可以被派生類,以及由此派生的其他類別使用。但是基類對外界用戶是不可見的。派生類的用戶不能訪問基類的成員、不能把派生類別轉換(造型)為基類的指針或引用。
私有繼承(private inheritance):基類的公有或保護內容僅可以被派生類訪問。但基類對派生類的子類或派生類的用戶都是不可見的。派生類的子類或派生類的用戶都不能訪問基類的內容、不能把派生類轉換為基類的指針或引用。
C++支持多繼承(multiple inheritance,MI)。多繼承(multiple inheritance,MI)的優缺點一直廣為用戶所爭議,許多語言(如Java)並不支持多重繼承,而改以單一繼承和接口繼承(interface inheritance),而另一些語言則采用用單一繼承和混入(mixin)。C++通過虛繼承(Virtual Inheritance)來解決多繼承帶來的一系列問題。
多態
除了封裝與繼承外,C++還提供了多態功能,面向對象的精神在於多態(Polymorphism),一般的多態,是指動態多態,系使用繼承和動態綁定(Dynamic Binding)實現,使用多態可創建起繼承體系(Inheritance hierarchy)。類(class)與繼承只是達成多態中的一種手段,所以稱面向對象而非面向類。
多態又分成靜態多態(Static Polymorphism)與動態多態(Dynamic Polymorphism)。C++語言支持的動態多態必須結合繼承和動態綁定(Dynamic Binding)方式實現。靜態多態是指編譯時決定的多態,包括重載和以模板(template)實現多態的方法即參數化類型(Parameterized Types),是使用宏(macro)的“程序代碼膨脹法”達到多態效果。
類型轉換(type cast)也是一種非參數化(ad hoc)多態的概念,C++提供dynamic_cast, static_cast等運算符來實現強制類型轉換(Coercion)。
操作數重載(operator overloading)或函數重載(function overloading)也算是多態的概念。