在具體了解Git之前,首先需要我們了解一下VCS,即版本控制系統(version control system
)
1、什么是版本控制系統
版本控制是一種記錄一個或若干個文件內容變化,以便將來查閱特定版本修訂情況的系統。版本控制系統不僅可以應用於軟件源代碼的文本文件,而且可以對任何類型的文件進行版本控制。
有了它你就可以將某個文件回溯到之前的狀態,甚至將整個項目都回退到過去某個時間點的狀態,你可以比較不同版本文件的變化細節,查出最后是誰修改了哪個地方。也就是無論文件最后被修改成什么樣子,你都可以輕松恢復到原先的樣子,但是額外增加的工作量卻微乎其微。
2、我們為什么要用版本控制
世界上無數大大小小的開發項目,都在使用各種各樣的版本控制系統,原因在於它的優點對於一個項目開發來說是無比重要。
比如一個最簡單的開發團隊,也許就兩三個人,他們共同完成一個軟件的開發。每個人都在修改、添加、刪除着自己本地硬盤上的代碼,當他們需要把這些代碼匯總起來時,麻煩出現了。到底誰改了哪些文件?具體是文件里的哪部分被改動過?A人員修改的內容會不會把B人員的修改的內容覆蓋掉,匯總工作就變得很危險,需要非常小心,一旦出錯后果不堪設想。顯然此時效率將會是無比的低下,如果某個地方出錯,可能整個匯總工作就要重來一遍。這只是兩三人的小團隊,如果是幾十人幾百人的大團隊呢?那將會是噩夢。
如果這個團隊采用了版本控制,那么版本控制軟件在每次提交文件的時候,都會主動合並所有人的修改,並解決可能發生的沖突。每個人手里一直都是匯總好的代碼,當開發進行到一定階段,可以直接拿去測試,不需要再有額外的工作來浪費時間。
3、版本管理系統的演變
(1)本地版本控制系統
許多人習慣用復制整個項目目錄的方式來保存不同的版本,或許還會改名加上備份時間以示區別。 這么做唯一的好處就是簡單,但是特別容易犯錯。 有時候會混淆所在的工作目錄,一不小心會寫錯文件或者覆蓋意想外的文件。
為了解決這個問題,人們很久以前就開發了許多種本地版本控制系統,大多都是采用某種簡單的數據庫來記錄文件的歷次更新差異。
這種形式主要實現了基本的代碼版本管理,但缺點是無法讓多人同時對一個版本庫進行修改。這個也和當時軟件規模不夠大有關,也沒有這樣的需求。
(2)集中化版本控制系統
接下來人們又遇到一個問題,如何讓在不同系統上的開發者協同工作? 於是,集中化的版本控制系統(Centralized Version Control Systems
,簡稱 CVCS)應運而生。 這類系統,諸如 CVS、Subversion
等,都有一個單一的集中管理的服務器,保存所有文件的修訂版本,而協同工作的人們都通過客戶端連到這台服務器,取出最新的文件或者提交更新。 多年以來,這已成為版本控制系統的標准做法。
這種做法帶來了許多好處,特別是相較於老式的本地 VCS 來說。 現在,每個人都可以在一定程度上看到項目中的其他人正在做些什么。 而管理員也可以輕松掌控每個開發者的權限,並且管理一個 CVCS 要遠比在各個客戶端上維護本地數據庫來得輕松容易。
事分兩面,有好有壞,集中管理的服務器最顯而易見的缺點是中央服務器的單點故障問題。 如果宕機一小時,那么在這一小時內,誰都無法提交更新,也就無法協同工作。 如果中心數據庫所在的磁盤發生損壞,又沒有做恰當備份,毫無疑問你將丟失所有數據,包括項目的整個變更歷史,只剩下人們在各自機器上保留的單獨快照。 本地版本控制系統也存在類似問題,只要整個項目的歷史記錄被保存在單一位置,就有丟失所有歷史更新記錄的風險。
集中式版本控制系統另外一個大的問題就是必須聯網才能工作,如果不能連接到中央服務器上,就不能對文件進行提交,還原,對比等操作。
(3)分布式版本控制系統
於是分布式版本控制系統(Distributed Version Control System
,簡稱 DVCS)面世了。 在這類系統中,像 Git
、Mercurial
、Bazaar
以及 Darcs
等,客戶端並不只提取最新版本的文件快照,而是把代碼倉庫完整地鏡像下來。 這么一來,任何一處協同工作用的服務器發生故障,事后都可以用任何一個鏡像,把本地倉庫恢復。 因為每一次的克隆操作,實際上都是一次對代碼倉庫的完整備份。
許多這類系統都可以指定和若干不同的遠端代碼倉庫進行交互。因此你就可以在同一個項目中,分別和不同工作小組的人相互協作。 你可以根據需要設定不同的協作流程,比如層次模型式的工作流,而這在以前的集中式系統中是無法實現的。
參考: