為什么要將系統進行拆分?
網上查查,答案極度零散和復雜,很瑣碎,原因一大坨。但是我這里給大家直觀的感受:
要是不拆分,一個大系統幾十萬行代碼,20 個人維護一份代碼,簡直是悲劇啊。代碼經常改着改着就沖突了,各種代碼沖突和合並要處理,非常耗費時間;經常我改動了我的代碼,你調用了我的,導致你的代碼也得重新測試,麻煩的要死;然后每次發布都是幾十萬行代碼的系統一起發布,大家得一起提心吊膽准備上線,幾十萬行代碼的上線,可能每次上線都要做很多的檢查,很多異常問題的處理,簡直是又麻煩又痛苦;而且如果我現在打算把技術升級到最新的 spring 版本,還不行,因為這可能導致你的代碼報錯,我不敢隨意亂改技術。
假設一個系統是 20 萬行代碼,其中 A 在里面改了 1000 行代碼,但是此時發布的時候是這個 20 萬行代碼的大系統一塊兒發布。就意味着 20 萬上代碼在線上就可能出現各種變化,20 個人,每個人都要緊張地等在電腦面前,上線之后,檢查日志,看自己負責的那一塊兒有沒有什么問題。
A 就檢查了自己負責的 1 萬行代碼對應的功能,確保 ok 就閃人了;結果不巧的是,A 上線的時候不小心修改了線上機器的某個配置,導致另外 B 和 C 負責的 2 萬行代碼對應的一些功能,出錯了。
幾十個人負責維護一個幾十萬行代碼的單塊應用,每次上線,准備幾個禮拜,上線 -> 部署 -> 檢查自己負責的功能。
拆分了以后,整個世界清爽了,幾十萬行代碼的系統,拆分成 20 個服務,平均每個服務就 1~2 萬行代碼,每個服務部署到單獨的機器上。20 個工程,20 個 git 代碼倉庫,20 個開發人員,每個人維護自己的那個服務就可以了,是自己獨立的代碼,跟別人沒關系。再也沒有代碼沖突了,爽。每次就測試我自己的代碼就可以了,爽。每次就發布我自己的一個小服務就可以了,爽。技術上想怎么升級就怎么升級,保持接口不變就可以了,真爽。
所以簡單來說,一句話總結,如果是那種代碼量多達幾十萬行的中大型項目,團隊里有幾十個人,那么如果不拆分系統,開發效率極其低下,問題很多。但是拆分系統之后,每個人就負責自己的一小部分就好了,可以隨便玩兒隨便弄。分布式系統拆分之后,可以大幅度提升復雜系統大型團隊的開發效率。
但是同時,也要提醒的一點是,系統拆分成分布式系統之后,大量的分布式系統面臨的問題也是接踵而來,所以后面的問題都是在圍繞分布式系統帶來的復雜技術挑戰在說。
如何進行系統拆分?
這個問題說大可以很大,可以扯到領域驅動模型設計上去,說小了也很小,我不太想給大家太過於學術的說法,因為你也不可能背這個答案,過去了直接說吧。還是說的簡單一點,大家自己到時候知道怎么回答就行了。
系統拆分為分布式系統,拆成多個服務,拆成微服務的架構,是需要拆很多輪的。並不是說上來一個架構師一次就給拆好了,而以后都不用拆。
第一輪;團隊繼續擴大,拆好的某個服務,剛開始是 1 個人維護 1 萬行代碼,后來業務系統越來越復雜,這個服務是 10 萬行代碼,5 個人;第二輪,1個服務 -> 5個服務,每個服務 2 萬行代碼,每人負責一個服務。
如果是多人維護一個服務,最理想的情況下,幾十個人,1 個人負責 1 個或 2~3 個服務;某個服務工作量變大了,代碼量越來越多,某個同學,負責一個服務,代碼量變成了 10 萬行了,他自己不堪重負,他現在一個人拆開,5 個服務,1 個人頂着,負責 5 個人,接着招人,2 個人,給那個同學帶着,3 個人負責 5 個服務,其中 2 個人每個人負責 2 個服務,1 個人負責 1 個服務。
個人建議,一個服務的代碼不要太多,1 萬行左右,兩三萬撐死了吧。
大部分的系統,是要進行多輪拆分的,第一次拆分,可能就是將以前的多個模塊該拆分開來了,比如說將電商系統拆分成訂單系統、商品系統、采購系統、倉儲系統、用戶系統,等等吧。
但是后面可能每個系統又變得越來越復雜了,比如說采購系統里面又分成了供應商管理系統、采購單管理系統,訂單系統又拆分成了購物車系統、價格系統、訂單管理系統。
扯深了實在很深,所以這里先給大家舉個例子,你自己感受一下,核心意思就是根據情況,先拆分一輪,后面如果系統更復雜了,可以繼續分拆。你根據自己負責系統的例子,來考慮一下就好了。
拆分后不用 dubbo 可以嗎?
當然可以了,大不了最次,就是各個系統之間,直接基於 spring mvc,就純 http 接口互相通信唄,還能咋樣。但是這個肯定是有問題的,因為 http 接口通信維護起來成本很高,你要考慮超時重試、負載均衡等等各種亂七八糟的問題,比如說你的訂單系統調用商品系統,商品系統部署了 5 台機器,你怎么把請求均勻地甩給那 5 台機器?這不就是負載均衡?你要是都自己搞那是可以的,但是確實很痛苦。
所以 dubbo 說白了,是一種 rpc 框架,就是說本地就是進行接口調用,但是 dubbo 會代理這個調用請求,跟遠程機器網絡通信,給你處理掉負載均衡、服務實例上下線自動感知、超時重試等等亂七八糟的問題。那你就不用自己做了,用 dubbo 就可以了。