大型項目架構演進過程及思考

本文轉載自查看原文 2019-10-08 19:22 831 JAVA進階

淘寶架構

我們以淘寶架構為例，了解下大型的電商項目的服務端的架構是怎樣，如圖所示

上面是一些安全體系系統，如數據安全體系、應用安全體系、前端安全體系等。
中間是業務運營服務系統，如會員服務、商品服務、店鋪服務、交易服務等。
還有共享業務，如分布式數據層、數據分析服務、配置服務、數據搜索服務等。
最下面呢，是中間件服務，如MQS即隊列服務，OCS即緩存服務等。

圖中也有一些看不到，例如高可用的一個體現，實現雙機房容災和異地機房單元化部署，為淘寶業務提供穩定、高效和易於維護的基礎架構支撐。

這是一個含金量非常高的架構，也是一個非常復雜而龐大的架構。當然這個也不是一天兩天演進成這樣的，也不是一上來就設計並開發成這樣高大上的架構的。

這邊就要說一下，小型公司要怎么做呢？對很多創業公司而言，很難在初期就預估到流量十倍、百倍以及千倍以后網站架構會是什么樣的一個狀況。同時，如果系統初期就設計一個千萬級並發的流量架構，很難有公司可以支撐這個成本。

因此，一個大型服務系統都是從小一步一步走過來的，在每個階段，找到對應該階段網站架構所面臨的問題，然后在不斷解決這些問題，在這個過程中整個架構會一直演進。
那我們來一起看一下。

單服務器-俗稱all in one

從一個小網站說起。一台服務器也就足夠了。文件服務器，數據庫，還有應用都部署在一台機器，俗稱ALL IN ONE

隨着我們用戶越來越多，訪問越來越大，硬盤，CPU，內存等都開始吃緊。一台服務器已經滿足不了。這個時候看一下下一步演進

數據服務與應用服務分離

我們將數據服務和應用服務分離，給應用服務器配置更好的 CPU，內存。而給數據服務器配置更好更大的硬盤。

分離之后提高一定的可用性，例如Files Server掛了，我們還是可以操作應用和數據庫等。
隨着訪問qps越來越高，降低接口訪問時間，提高服務性能和並發，成為了我們下一個目標，發現有很多業務數據不需要每次都從數據庫獲取。

使用緩存，包括本地緩存，遠程緩存，遠程分布式緩存

因為 80% 的業務訪問都集中在 20% 的數據上，也就是我們經常說的28法則。如果我們能將這部分數據緩存下來，性能一下子就上來了。而緩存又分為兩種：本地緩存和遠程緩存緩存，以及遠程分布式緩存，我們這里面的遠程緩存圖上畫的是分布式的緩存集群(Cluster)。

思考的點

. 具有哪種業務特點數據使用緩存？
. 具有哪種業務特點的數據使用本地緩存？
. 具有哪種務特點的數據使用遠程緩存？
. 分布式緩存在擴容時候會碰到什么問題？如何解決？分布式緩存的算法都有哪幾種？各有什么優缺點？

這個時候隨着訪問qps的提高，服務器的處理能力會成為瓶頸。雖然是可以通過購買更強大的硬件，但總會有上限，而且這個到后期成本就是指數級增長了，這時，我們就需要服務器的集群。需要使我們的服務器可以橫向擴展，這時，就必須加個新東西：負載均衡調度服務器。

使用負載均衡，進行服務器集群

增加了負載均衡，服務器集群之后，我們可以橫向擴展服務器，解決了服務器處理能力的瓶頸。

思考的點

. 負載均衡的調度策略都有哪些？
. 各有什么優缺點？
. 各適合什么場景？

打個比方，我們有輪詢，權重，地址散列，地址散列又分為原ip地址散列hash，目標ip地址散列hash，最少連接，加權最少連接，還有繼續升級的很多種策略......我們一起來分析一下

典型負載均衡策略分析

. 輪詢：優點：實現簡單，缺點：不考慮每台服務器處理能力
. 權重：優點：考慮了服務器處理能力的不同
. 地址散列：優點：能實現同一個用戶訪問同一個服務器
. 最少連接：優點：使集群中各個服務器負載更加均勻
. 加權最少連接：在最少連接的基礎上，為每台服務器加上權值。算法為(活動連接數*256+非活動連接數)/權重，計算出來的值小的服務器優先被選擇。

繼續引出問題的場景：

我們的登錄的時候登錄了A服務器，session信息存儲到A服務器上了，假設我們使用的負載均衡策略是ip hash，那么登錄信息還可以從A服務器上訪問，但是這個有可能造成某些服務器壓力過大，某些服務器又沒有什么壓力，這個時候壓力過大的機器(包括網卡帶寬)有可能成為瓶頸，並且請求不夠分散。

這時候我們使用輪詢或者最小連接負載均衡策略，就導致了，第一次訪問A服務器，第二次可能訪問到B服務器，這個時候存儲在A服務器上的session信息在B服務器上讀取不到。

Session管理-Session Sticky粘滯會話：

打個比方就是如果我們每次吃飯都要保證我們用的是自己的碗筷，而只要我們在一家飯店里存着我們的碗筷，只要我們每次去這家飯店吃飯就好了。

對於同一個連接中的數據包，負載均衡會將其轉發至后端固定的服務器進行處理。

解決了我們session共享的問題，但是它有什么缺點呢？

. 一台服務器運行的服務掛掉，或者重啟，上面的 session 都沒了
. 負載均衡器成了有狀態的機器，為以后實現容災造成了羈絆

Session管理-Session 復制

就像我們在所有的飯店里都存一份自己的碗筷。我們隨意去哪一家飯店吃飯都OK，不適合做大規模集群，適合機器不多的情況。

解決了我們session共享的問題，但是它有什么缺點呢？

. 應用服務器間帶寬問題，因為需要不斷同步session數據
. 大量用戶在線時，服務器占用內存過多

Session管理-基於Cookie

打個比方，就是我們每次去飯店吃飯，都自己帶着自己的碗筷。

解決了我們session共享的問題，但是它有什么缺點呢？

. cookie 的長度限制
. cookie存於瀏覽器，安全性是一個問題

Session管理-Session 服務器

打個比方，就是我們的碗筷都存在了一個龐大的櫥櫃里，我們去任何一家飯店吃飯，都可以從櫥櫃中拿到屬於我們自己的碗筷。

解決了我們session共享的問題，這種方案需要思考哪些問題呢？

. 保證 session 服務器的可用性，session服務器單點如何解決？
. 我們在寫應用時需要做調整存儲session的業務邏輯

打個比方，我們為了提高session server的可用性，可以繼續給session server做集群

中間總結

所以說，網站架構在遇到某些指標瓶頸時，演進的過程中，都有哪些解決方案，他們都有什么優缺點？業務功能上如何取舍？如何做出選擇？這個過程才是最重要的。

在解決了橫向擴展應用服務器之后，那我們繼續~~

繼續回到目前架構圖

數據庫的讀及寫操作都還需要經過數據庫。當用戶量達到一定量，數據庫將會成為瓶頸。那我們如何來解決呢？

數據庫讀寫分離

使用數據庫提供的熱備功能，將所有的讀操作引入slave 服務器，因為數據庫的讀寫分離了，所以，我們的應用程序也得做相應的變化。我們實現一個數據訪問模塊(圖中的data access module)使上層寫代碼的人不知道讀寫分離的存在。這樣多數據源讀寫分離就對業務代碼沒有了侵入。這里就引出了代碼層次的演變

思考的點