一、基本介紹
Git是目前世界上最先進的分布式版本控制系統,其實 Git 跟 SVN一樣有自己的集中式版本庫或服務器,但是Git 更傾向於被使用於分布式模式,也就是每個開發人員從中心版本庫/服務器上chect out代碼后會在自己的機器上克隆一個跟中心版本庫一模一樣的本地版本庫。SVN(Subversion)是集中式管理的版本控制器,而Git是分布式管理的版本控制器!這是兩者之間最核心的區別。
SVN只有一個單一的集中管理的服務器,保存所有文件的修訂版本,而協同工作的人們都通過客戶端連到這台服務器,取出最新的文件或者提交更新。
Git每一個終端都是一個倉庫,客戶端並不只提取最新版本的文件快照,而是把原始的代碼倉庫完整地鏡像下來。每一次的提取操作,實際上都是一次對代碼倉庫的完整備份。Git不僅僅是個版本控制系統,它也是個內容管理系統(CMS),工作管理系統等。如果你是一個具有使用SVN背景的人,你需要做一定的思想轉換,來適應Git提供的一些概念和特征。
二、集中式版本控制與分布式版本控制
集中式版本控制系統:
版本庫是集中存放在中央服務器的,而干活的時候,用的都是自己的電腦,所以要先從中央服務器取得最新的版本,然后開始干活,干完活了,再把自己的活推送給中央服務器。中央服務器就好比是一個圖書館,你要改一本書,必須先從圖書館借出來,然后回到家自己改,改完了,再放回圖書館。
集中式版本控制系統最大的毛病就是必須聯網才能工作,如果在局域網內還好,帶寬夠大,速度夠快,可如果在互聯網上,遇到網速慢的話,可能提交一個10M的文件就需要5分鍾。
分布式版本控制系統:
首先,分布式版本控制系統根本沒有"中央服務器",每個人的電腦上都是一個完整的版本庫,這樣,你工作的時候,就不需要聯網了,因為版本庫就在你自己的電腦上。既然每個人電腦上都有一個完整的版本庫,那多個人如何協作呢?比方說你在自己電腦上改了文件A,你的同事也在他的電腦上改了文件A,這時,你們倆之間只需把各自的修改推送給對方,就可以互相看到對方的修改了。
和集中式版本控制系統相比,分布式版本控制系統的安全性要高很多,因為每個人電腦里都有完整的版本庫,某一個人的電腦壞掉了不要緊,隨便從其他人那里復制一個就可以了。而集中式版本控制系統的中央服務器要是出了問題,所有人都沒法干活了。
在實際使用分布式版本控制系統的時候,其實很少在兩人之間的電腦上推送版本庫的修改,因為可能你們倆不在一個局域網內,兩台電腦互相訪問不了,也可能今天你的同事病了,他的電腦壓根沒有開機。因此,分布式版本控制系統通常也有一台充當"中央服務器"的電腦,但這個服務器的作用僅僅是用來方便"交換"大家的修改,沒有它大家也一樣干活,只是交換修改不方便而已。
當然,Git的優勢不單是不必聯網這么簡單,后面我們還會看到Git極其強大的分支管理,把SVN等遠遠拋在了后面。
三、Git和SVN對比
3.1、集中式VS分布式
(1)SVN屬於集中式的版本控制系統
集中式的版本控制系統都有一個單一的集中管理的服務器,保存所有文件的修訂版本,而協同工作的人們都通過客戶端連到這台服務器,取出最新的文件或者提交更新。
SVN的特點概括起來主要由以下幾條:
1)每個版本庫有唯一的URL(官方地址),每個用戶都從這個地址獲取代碼和數據;
2)獲取代碼的更新,也只能連接到這個唯一的版本庫,同步以取得最新數據;
3)提交必須有網絡連接(非本地版本庫);
4)提交需要授權,如果沒有寫權限,提交會失敗;
5)提交並非每次都能夠成功。如果有其他人先於你提交,會提示"改動基於過時的版本,先更新再提交"… 諸如此類;
6)沖突解決是一個提交速度的競賽:手快者,先提交,平安無事;手慢者,后提交,可能遇到麻煩的沖突解決。
好處:每個人都可以一定程度上看到項目中的其他人正在做些什么。而管理員也可以輕松掌控每個開發者的權限。
缺點:中央服務器的單點故障。
若是宕機一小時,那么在這一小時內,誰都無法提交更新、還原、對比等,也就無法協同工作。如果中央服務器的磁盤發生故障,並且沒做過備份或者備份得不夠及時的話,還會有丟失數據的風險。最壞的情況是徹底丟失整個項目的所有歷史更改記錄,被客戶端提取出來的某些快照數據除外,但這樣的話依然是個問題,你不能保證所有的數據都已經有人提取出來。
簡單來說,SVN原理上只關心文件內容的具體差異。每次記錄有哪些文件作了更新,以及都更新了哪些行的什么內容。
(2)Git屬於分布式的版本控制系統
Git記錄版本歷史只關心文件數據的整體是否發生變化。Git 不保存文件內容前后變化的差異數據。
實際上,Git 更像是把變化的文件作快照后,記錄在一個微型的文件系統中。每次提交更新時,它會縱覽一遍所有文件的指紋信息並對文件作一快照,然后保存一個指向這次快照的索引。為提高性能,若文件沒有變化,Git 不會再次保存,而只對上次保存的快照作一連接。
在分布式版本控制系統中,客戶端並不只提取最新版本的文件快照,而是把原始的代碼倉庫完整地鏡像下來。這么一來,任何一處協同工作用的服務器發生故障,事后都可以用任何一個鏡像出來的本地倉庫恢復。這類系統都可以指定和若干不同的遠端代碼倉庫進行交互。籍此,你就可以在同一個項目中,分別和不同工作小組的人相互協作。你可以根據需要設定不同的協作流程。
另外,因為Git在本地磁盤上就保存着所有有關當前項目的歷史更新,並且Git中的絕大多數操作都只需要訪問本地文件和資源,不用連網,所以處理起來速度飛快。用SVN的話,沒有網絡或者斷開VPN你就無法做任何事情。但用Git的話,就算你在飛機或者火車上,都可以非常愉快地頻繁提交更新,等到了有網絡的時候再上傳到遠程的鏡像倉庫。換作其他版本控制系統,這么做幾乎不可能,抑或是非常麻煩。
Git特點:
1)Git中每個克隆(clone)的版本庫都是平等的。你可以從任何一個版本庫的克隆來創建屬於你自己的版本庫,同時你的版本庫也可以作為源提供給他人,只要你願意。
2)Git的每一次提取操作,實際上都是一次對代碼倉庫的完整備份。
3)提交完全在本地完成,無須別人給你授權,你的版本庫你作主,並且提交總是會成功。
4)甚至基於舊版本的改動也可以成功提交,提交會基於舊的版本創建一個新的分支。
5)Git的提交不會被打斷,直到你的工作完全滿意了,PUSH給他人或者他人PULL你的版本庫,合並會發生在PULL和PUSH過程中,不能自動解決的沖突會提示您手工完成。
6)沖突解決不再像是SVN一樣的提交競賽,而是在需要的時候才進行合並和沖突解決。
除此之外:
1)Git也可以模擬集中式的工作模式
Git版本庫統一放在服務器中
可以為 Git 版本庫進行授權:誰能創建版本庫,誰能向版本庫PUSH,誰能夠讀取(克隆)版本庫
團隊的成員先將服務器的版本庫克隆到本地;並經常的從服務器的版本庫拉(PULL)最新的更新;
團隊的成員將自己的改動推(PUSH)到服務器的版本庫中,當其他人和版本庫同步(PULL)時,會自動獲取改變
2)Git 的集中式工作模式非常靈活
你完全可以在脫離Git服務器所在網絡的情況下,如移動辦公/出差時,照常使用代碼庫
你只需要在能夠接入Git服務器所在網絡時,PULL和PUSH即可完成和服務器同步以及提交
Git提供rebase 命令,可以讓你的改動看起來是基於最新的代碼實現的改動
3)Git有更多的工作模式可以選擇,遠非 Subversion能比的。
3.2、用法上理解
(1)Git是分布式的,而SVN不是分布而是集中式的,需要說明的是Git並不是目前唯一的分布式版本控制系統,還有比如Mercurial等,所以說它們差不許多。不過話說回來Git跟Svn一樣有自己的集中式版本庫和Server端,但Git更傾向於分布式開發,因為每一個開發人員的電腦上都有一個LocalRepository以即使沒有網絡也一樣可以Commit,查看歷史版本記錄,創建項目分支等操作,等網絡再次連接上Push到Server端。
從上面看GIt真的很棒,但是GIt adds Complexity,剛開始使用會有些疑惑,因為需要建兩個Repositories(Local Repositories & Remote Repositories),指令很多,除此之外你需要知道哪些指令在Local Repository,哪些指令在Remote Repository。
(2)Git把內容按元數據方式存儲,而SVN是按文件:因為git目錄是處於你的機器上的一個克隆版的版本庫,它擁有中心版本庫上所有的東西,例如標簽,分支,版本記錄等。.git目錄的體積大小跟.svn比較,你會發現它們差距很大。
(3)Git沒有一個全局版本號,而SVN有:目前為止這是跟SVN相比Git缺少的最大的一個特征。
(4)Git的內容的完整性要優於SVN: GIT的內容存儲使用的是SHA-1哈希算法。這能確保代碼內容的完整性,確保在遇到磁盤故障和網絡問題時降低對版本庫的破壞。
(5)Git下載下來后,在OffLine狀態下可以看到所有的Log,SVN不可以。
(6)剛開始用時很狗血的一點,SVN必須先Update才能Commit,忘記了合並時就會出現一些錯誤,git還是比較少的出現這種情況。
(7)克隆一份全新的目錄以同樣擁有五個分支來說,SVN是同時復製5個版本的文件,也就是說重復五次同樣的動作。而Git只是獲取文件的每個版本的 元素,然后只載入主要的分支(master)在我的經驗,克隆一個擁有將近一萬個提交(commit),五個分支,每個分支有大約1500個文件的 SVN,耗了將近一個小時!而Git只用了區區的1分鍾!
(8)版本庫(repository):SVN只能有一個指定中央版本庫。當這個中央版本庫有問題時,所有工作成員都一起癱瘓直到版本庫維修完畢或者新的版本庫設立完成。而 Git可以有無限個版本庫。或者,更正確的說法,每一個Git都是一個版本庫,區別是它們是否擁有活躍目錄(Git Working Tree)。如果主要版本庫(例如:置於GitHub的版本庫)發生了什麼事,工作成員仍然可以在自己的本地版本庫(local repository)提交,等待主要版本庫恢復即可。工作成員也可以提交到其他的版本庫!
(9)分支(Brach)不同。
分支在SVN中一點不特別,分支在SVN就是版本庫中的另外一個完整目錄,且這個目錄擁有完整的實際文件。如果你想知道是否合並了一個分支,你需要手工運行像這樣的命令svn propget svn:mergeinfo,來確認代碼是否被合並。所以,經常會發生有些分支被遺漏的情況。如果工作成員想要開啟新的分支,那將會影響"全世界"!每個人都會擁有和你一樣的分支。如果你的分支是用來進行破壞工作(安檢測試),那將會像傳染病一樣,你改一個分支,還得讓其他人重新切分支重新下載,十分狗血。而 Git,每個工作成員可以任意在自己的本地版本庫開啟無限個分支。舉例:當我想嘗試破壞自己的程序(安檢測試),並且想保留這些被修改的文件供日后使用, 我可以開一個分支,做我喜歡的事。完全不需擔心妨礙其他工作成員。只要我不合並及提交到主要版本庫,沒有一個工作成員會被影響。等到我不需要這個分支時, 我只要把它從我的本地版本庫刪除即可。無痛無癢。
然而,處理GIT的分支卻是相當的簡單和有趣。你可以從同一個工作目錄下快速的在幾個分支間切換。你很容易發現未被合並的分支,你能簡單而快捷的合並這些文件。Git的分支名是可以使用不同名字的。例如:我的本地分支名為OK,而在主要版本庫的名字其實是master。最值得一提,我可以在Git的任意一個提交點(commit point)開啟分支!(其中一個方法是使用gitk –all 可觀察整個提交記錄,然后在任意點開啟分支。)
(10)提交(Commit)上的不同:在SVN,當你提交你的完成品時,它將直接記錄到中央版本庫。當你發現你的完成品存在嚴重問題時,你已經無法阻止事情的發生了。如果網路中斷,你根本沒辦法提交!而Git的提交完全屬於本地版本庫的活動。而你只需"推"(git push)到主要版本庫即可。Git的"推"其實是在執行"同步"(Sync)。
四、項目開發中什么時候需要創建一個分支
舉個例子:我們需要開發一個新的網站,我們已經在主分支(master分支)上開發出了1.0發布版本,這個時候我們需要開發某個新的功能模塊,那就需要創建一個分支(dev分支),而不是在主分支上繼續開發,這樣做有兩個好處:
我們在開發新的功能模塊時,可能會遇到各種bug或者沖突,如果我們還在主分支上開發,萬一沖突很嚴重,造成當前穩定版本的分支出問題,就會很麻煩。如果主分支始終保留着最新的穩定版本,在新的分支上開發,沖突嚴重時,最多也就是把當前分支刪掉,從那個穩定分支重新分一支出來,這樣處理起來就方便了,而且分支還可以保留開發中可能出現的各種bug方便修復但不影響主分支多的使用。
當我們需要切換分支,例如切換到主分支(master)時候,會保存當前分支(dev)的狀態,以便日后繼續開發,防止丟失開發進度。舉個例子:你突然接到一個電話說1.0發布版本有個很嚴重的問題需要緊急修補,而我們正在dev分支上開發新的功能模塊,這時我們先返回到主分支,為這次緊急修補建立一個新分支(repair分支),並在其中修復問題。通過測試后,回到主分支,將repair分支合並進來,然后push到遠程倉庫。最后,我們切換到之前開發新需求的dev分支,繼續工作而不會丟失掉已經開發的進度。
我可以在Git的任意一個提交點(commit point)開啟分支!(其中一個方法是使用gitk –all 可觀察整個提交記錄,然后在任意點開啟分支。)
Git具有以下特點:
Git 中每個克隆(clone)的版本庫都是平等的。可以從任何一個版本庫的克隆來創建屬於自己的版本庫,同時你的版本庫也可以作為源提供給他人,只要你願意。
Git 的每一次提取操作,實際上都是一次對代碼倉庫的完整備份。
提交完全在本地完成,無須別人給你授權,你的版本庫你作主,並且提交總是會成功。
Git 的提交不會被打斷,直到你的工作完全滿意了,PUSH給他人或者他人PULL你的版本庫,合並會發生在PULL和PUSH過程中,不能自動解決的沖突會提示你手工完成。