一、千呼萬喚始出來
親愛的各位讀者,我的新書《C++ 服務器開發精髓》終於終於終於與大家見面了,圖書如下:
圖書的封面設計很精美,當然內容一定不負眾望。因出版社老師要求提供一張照片放到封面上,今年的 6 月 1 日兒童節去拍了一張,照片拍出來放在下面大家自己看吧。人到中年,生活不易,沒有少年時代那種懵懂與青澀,多了一份厚實與堅定了。一些想做的事情卻一步步把它做成了,成為現實。昔日戲言身后事,明朝都到眼前來。所以,夢想還是要有的,還是要堅持的,即使這世界有那么多不完善,生活有那么多不如意,因為萬一實現了呢?
二、寫書的故事
關於這本書,我寫了三年,故事太長了,容我細細道來。
2018 年的時候,我去攜程旅行網工作,那個時候攜程正在招一個具有 C/C++ 背景的 Java 資深開發,而我正好符合這樣的要求。那會兒,我已經玩了許多年的知乎,在知乎上也回答了一些 C/C++ 與 Linux 后台開發相關的問題,有些回答竟然達到了幾千贊和收藏,有一些出版社編輯老師在知乎上找到我,問我有沒有寫一本關於 C++ 或者服務器方面的圖書,我考慮時機不成熟,就都一一婉拒了。
后來我抱着玩兒的心態嘗試在公眾號發表文章,沒想到一下子打開了一個充滿奇幻的未知大門。在公眾號互推的過程中結識了艷鵬,彼時他已經出版了一本口碑很好的分布式服務相關的圖書,另外一本書也在寫作中。艷鵬告訴我,和他對接的出版社編輯老師非常靠譜,可以推薦給我。於是,我就接受了他的推薦,沒想到沒過多久,出版社老師就發來約稿合同,我那個時候也沒想到會這么快,就“糊里糊塗”地簽了合同。
人嘛,有時候不逼自己一把,你永遠不知道自己能成事。既然簽了合同,那就得認真對待,而且合同上也有交稿日期,雖然出版社老師說,延期一般提前溝通問題也不大,就算最終作者沒寫出來,出版社一般也不會追究責任和賠償。
既然答應下來,書還是要好好寫的,我寫書分為幾個階段,第一個階段是列書的大綱目錄和章節,同時列舉每一節要寫的內容;第二階段是實際的寫作階段,這個階段時間花的最長;第三階段是潤色與優化階段,我把書的內容發給了一些相關同行和讀者,請他們提出一些修改建議和意見,同時,補充了一些后來工作和學習中一些新的想法與有用的技巧。2019 年年初又應朋友邀請一起創業,是早期團隊三個主要開發之一。工作就更忙了,加上那個時候也是單休,只能利用早早晚晚或者節假日的時間去寫作。
就這樣斷斷續續地寫了兩年,期間有些章節反復的修改。大家都知道的,在如今講究速成的年代,出一本關於 C/C++ 圖書是很需要勇氣的,企業要求快速化生產與 學習周期長、學習難度大的 C/C++ 技術棧之間的矛盾讓很多同學望而卻步,一些新人在嘗試之后學不得法或者被浮躁的網文的宣傳而最終放棄。
C/C++ 技術棧一旦學成,奇妙無窮。那么,C/C++ 技術棧到底該如何學好呢?筆者雖然經驗有限,但仍恬以剖析之。
按照技術掌握的深度,一般分為兩個層級,第一個層級是開發熟練工,第二個階段是融匯貫通階段。
三、無窮歲月增中減,有味詩書苦后甜
3.1 開發熟練工階段
C/C++ 這門語言與其他高級語言不同,它是離操作系統較近的語言。所以學好 C/C++ 體系的技術棧必須結合操作系統的運行機制來學習。展開來說,就是你必須掌握操作系統層面的幾大基礎知識,他們是匯編、編譯鏈接與運行時體系、狹義的操作系統原理、多線程、網絡編程。
第一個基礎知識是匯編,我們學習匯編不是一定要用匯編來寫代碼,就像我們學習 C/C++ 也不一定單純為了面試和找工作。
對於 C/C++ 的同學來說,匯編是建議一定要掌握的,只有這樣,你才能在書寫 C++ 代碼的時候,清楚地知道你的每一行C++代碼背后對應着什么樣的機器指令,if/for/while 等基本程序結構如何實現的,函數的返回值如何返回的,為什么整型變量的數學運算不是原子的,最終你知道如何書寫代碼才能做到效率最高。掌握了匯編,你可以明白,在 C++ 中,一個棧對象從構造到析構,其整個生命周期里,開發者的代碼、編譯器和操作系統分別做了什么。掌握了匯編,你可以理解函數調用是如何實現的,你可以理解函數的幾種調用方法,為什么printf這樣的函數其調用方式不能是 __stdcall,而必須是 __cdecl。掌握了匯編,你就能明白為什么一個類對象增加一個方法不會增加其實際占的內存空間。
第二個基礎知識是編譯、鏈接與運行時體系知識。作為一個開發者,要清楚地知道我們寫的 C/C++ 程序是如何通過預處理、編譯與鏈接等步驟最終變成可執行的二進制文件,操作系統如何識別一個文件為可執行文件,一個可執行文件包含什么內容,執行時如何加載到進程的地址空間,程序的每一個變量和數據位於進程地址空間的什么位置,如何引用到。一個進程的地址空間有些什么內容,各段地址分布着什么內容,為什么讀寫空指針或者野指針會有內存問題。一個進程如何裝在各個 so 或 dll 文件的,這些文件被加載到進程地址空間的什么位置,如何被執行,數據如何被交換。
第三個基礎知識是狹義的操作系統原理。這里加上“狹義”二字是因為從廣義上來講,以上所說的內容都是操作系統原理的范疇。狹義的操作系統原理這里包括操作系統如何管理進程與線程,虛擬內存與物理內存之間的對應關系,何為內存映射文件,進程之間如何通信等等。
第四個基礎知識是多線程知識。嚴格來說,這點已經包括在第三點之中了,我之所以將其單獨列出來,是因為多線程編程是我們做應用服務最常用的技術之一。最近面試過幾個學歷非常好的同學,對於一個進程中如果某個線程因為內存問題而退出,是否會導致整個進程退出的問題答不好,實在不應該。多線程知識其實不難學,立足於理解與實踐而不是應付面試,可以學的很好。無論是 Windows 還是 Linux 操作系統,操作系統提供的線程同步對象就那么幾種,Windows 常用的有臨界區(關鍵端)、Event、互斥體、信號量等,Linux 有互斥體、信號量、讀寫鎖、條件變量,這些知識點學過則會,不學則不會。這些線程同步原語花上幾天就能搞得清楚,大多數同學不是學不會,而是不願意學,但是偏偏喜歡在簡歷上寫上自己熟悉多線程編程。面試的時候,被問到條件變量的虛假喚醒機制都說不清楚,非要說自己用過條件變量。這是一些同學犯的很低級的錯誤,如果真用過條件變量,如果不知道虛假喚醒機制,那一定寫的代碼是不對的。市場上目前沒有任何一本圖書對以上知識形成體系的介紹,當然,我的本書填補了這一空缺,你將從本書中獲得從進程與線程的關系,再到常用的線程同步原語的區別與使用場景,再到線程池以及基於生產者消費者模型的消息隊列,以及對協程思想介紹的相關知識。
掌握了常見的多線程同步原語之后,接下來可以找一些帶多線程的項目去學習一下,不管是否帶 UI 的都行。我推薦的一種方式是,使用 gdb 或者 Visual Studio 調試器將你需要學習的多線程程序中斷下來,在多線程面板,看看這個進程一共有多少個正在運行的線程,分析每個線程的作用,然后研究下這些線程在何時何地創建的,為什么需要創建新的線程。嘗試愛過幾個人,面對愛情你會誠實很多;嘗試研究幾個多線程項目,面對多線程你會熟練許多。
第五個是網絡編程,直白地說就是 Socket 編程。操作系統層面提供的 API 會在相當長的時間內保持接口不變,一旦學成,終生受用。理解和掌握常用的基礎 socket API 不僅可以最大化地去定制各種網絡通信框架,更不用說使用市面上流行的網絡通信庫了,最重要的是,它會是你排查各種網絡疑難雜症堅實的技術保障。操作系統層面提供的網絡模型就那么幾種,無論像 Java/Go/Python 等語言如何封裝,作為技術的源頭,我們有什么理由不去掌握它呢?市面上關於網絡編程的書很多,我在書中結合我這些年的工作經驗總結了二十幾個網絡編程中的重點和難點,現在全部交給你。
以上是基於 C++ 技術棧來說,並沒有包括算法與數據結構、數據庫等方面的基本功,但是這些額外的也是應該需要掌握的。掌握了如上所說的,你就達到了一個熟練工階段。
3.2 融匯貫通階段
掌握了這些基礎知識,接下來,技術更進一步,就無關具體的編程語言了,互聯網方向的高級技術有如下:
高可用與容災容錯
服務都是人開發的,既然是人開發的,必然有宕機的可能性,當然宕機的原因可能是程序自身 bug,也可能是物理故障(斷電、磁盤損壞等等),作為開發人員,針對不同的業務場景,我們沒法做到服務 100% 可能,至少讓其盡量可用,八仙過海各顯神通。在宕機時如何盡量不影響業務、如何盡量快速恢復、如何保證數據和業務狀態不丟失等等。這當然有一定的固定套路,例如主從、主備,當然固定的套路不是萬能的,尤其是對於一些有狀態要求的服務,這需要不斷的磨練與自我總結。
分布式
分布式你需要掌握基本的分布式理論和原理,常見的分布式算法,然后是分布式系統設計的初衷和技巧,在實際並發量高的業務中,如何利用分布式解決高可用和訪問效率問題。
RPC
很多人都聽說過這個詞,在面試時也可以說出來個大概,但是當問到 RPC 技術解決的核心問題是什么就說不清楚了。當然,學習 RPC,我們還要考慮協議的設計(協議格式、序列化與反序列化、兼容性問題)、網絡連接的重試與反饋、接口 stub 的設計等等。
消息中間件
目前除了自己公司自研的消息中間件,主流的有 Kafka、RabbitMQ、RocketMQ,如果想學習,建議選擇其中一種深入學習一下,要掌握消息中間件的用途、選舉策略、保序策略、重試策略、高可用策略等。
緩存
緩存的設計是一個很大的方面,個人覺得與其說這是一種設計思想而非單純的某個緩存服務。當然,老生常談的有緩存雪崩、緩存穿透、緩存擊穿的解決思路。當然,以緩存為代表的服務是 Redis,Redis 的常用數據類型、適用場景、持久化、主從復制、哨兵與集群,這些建議你掌握,如果你從來沒機會吃豬肉,那就看看豬跑吧,一些技術書籍和項目案例都有 Redis 的用途說明。
數據庫高級知識
包括 SQL 調優、數據庫調優、分表分庫、主從同步等等。
四、天下還有不會武功的百姓
融會貫通階段遠非僅僅需要掌握這么多知識。說了這么多,我能用一張圖來表達一下我的見解吧:
《C++ 服務器開發精髓》這本書正是一本幫你成為 C/C++ 技術棧的熟練工的書。當然,這本書除了詳細講解了 C++11/14/17 新標准常用的方法以外,只是以 C/C++ 為編程語言來介紹相關的后端開發技術棧,這不是一本講 C/C++ 語言本身的書,講 C/C++ 語言的書太多了,多如過江之鯽。
后來,2020 年年初因為一些原因,我離開了創業團隊,加入了另外一家獨角獸公司。此時這本書的全部章節已經基本寫完了,當我把他交給出版社老師的時候,我們產生了激烈的“交鋒”,最后,這版書稿一共改了 8 個版本:
時至今日,我工作中寫 C/C++ 的機會並不多,但是這是我接觸 C/C++ 開發十年來,從客戶端到服務器,從 Windows 到 Linux 的經驗總結,如果它能助你職業生涯一臂之力,那我這一千多個日夜的付出就沒有白費。
有讀者給我留言說:
認真的人無論在哪條路上走,總會碰到相似的情況。偶然看到你開源的博客,作為吃瓜群眾過來看看開發者是怎樣的人。嘆息一聲:中國人才真多。可為啥普通用戶就是找不到好軟件用呢?可能大俠們都醉心於武學去了,小俠們醉心於賺錢去了,忘記了天下還有不會武功的百姓。
一路走來,感謝所有幫助過我的人,也感謝知乎上支持我的讀者。
最后,我希望你,也祝願你掌握 C/C++ 服務器開發這門武功。
圖書已經在京東開始有售,下單鏈接(可以拷貝到瀏覽器中打開):
https://item.jd.com/13312460.html
原文鏈接:《在 2021 年出版一本 C++ 圖書是一種什么體驗?》