圖解分布式架構的演進


  參考:https://www.cnblogs.com/my376908915/p/6813321.html

一、什么是分布式架構

  分布式系統(distributed system) 是建立在網絡之上的軟件系統。

  內聚性:是指每一個數據庫分布節點高度自治,有本地的數據庫管理系統。

  透明性:是指每一個數據庫分布節點對用戶的應用來說都是透明的,看不出是本地還是遠程。

  

  在分布式數據系統中,用戶感覺不數據是分布的,即用戶不須知道關系是否分割,有無副本,數據存在於那個站點以及事物在哪個站點上執行。

  簡單來說:在一個分布式系統中,一組獨立的計算機展現給用戶的是一個統一的整體,就好像是一個系統似的。

  

分布式系統作為一個整體對用戶提供服務,而整個系統的內部的協作對用戶來說是透明的,用戶就像是指使用一個mysql 一樣。

如:分布式mysql中間件 mycat ,來處理大並發大數據量的構架。

 

二、分布式架構的應用

  1、分布式文件系統

    例如:出名的有 Hadoop 的 HDFS, 還有 google的 GFS , 淘寶的 TFS 等

  2、分布式緩存系統

    例如:memcache , hbase, mongdb 等

  3、分布式數據庫

    例如:mysql, mariadb, postgreSql 等

  4、分布式webService

  5、分布式計算

  舉例

    以分布式mysql 數據庫中間件mycat 為例    

    MySQL 在現在電商以及互聯網公司的應用非常多,一個是因為他的免費開源,另外一個原因是因為分布式系統的水平可擴展性,隨着移動互聯網用戶的暴增,互聯網公司,像淘寶,天貓,唯品會等

    電商都采用分布式系統應對用戶的高並發量以及大數據量的存儲。而在Mycat的商業案例中,有對中國移動的賬單結算項目中,應用實時處理高峰期每天2億的數據量,在對物聯網的項目中,實現處理

    高達26億的數據量,並提供實時查詢的接口。

    通過對MyCat的學習,加深分布式系統架構的理解,以及分布式相關的技術,分布式一致性ZooKeeper服務, 高可用HAProxy/keepalived等相關應用。

    1> 集群 與 分布式

    2> 負載均衡

    3> 分布式相關的高可用、容災等名詞解釋

    4> Mycat 中間件學習

三、資源推薦

  1、大型分布式網站架構設計與實踐   

  2、大型網站技術架構:核心原理與案例分析   

  3、大型網站系統與Java中間件實踐   

  4、分布式Java應用:基礎與實踐   

四、分布式架構的演進

  (1)始階段架構 

  

  特征:應用程序,數據庫,文件等所有資源都放在一台服務器上。

 

  (2)應用服務 和 數據服務 以及 文件服務 分離

   

  說明:好景不長,發現隨着系統訪問量的再度增加,webserver機器的壓力在高峰期會上升到比較高,這個時候開始考慮增加一台webserver。

  特征:應用程序、數據庫、文件分別部署在獨立的資源上。

 

  (3)使用緩存改善性能

  

  說明:系統訪問特點遵循二八定律,即80%的業務訪問集中在20%的數據上。

     緩存分為 本地緩存 和 遠程分布式緩存,本地緩存訪問速度更快但緩存數據量有限,同時存在與應用程序爭用內存的情況。

  特征:數據庫中訪問較集中的一小部分數據存儲在緩存服務器中,減少數據庫的訪問次數,降低數據庫的訪問壓力。


  (4)使用“應用服務器”集群
    

    說明:在做完分庫分表這些工作后,數據庫上的壓力已經降到比較低了,又開始過着每天看着訪問量暴增的幸福生活了。

       突然有一天,發現系統的訪問又開始有變慢的趨勢了,這個時候首先查看數據庫,壓力一切正常,之后查看webserver,發現apache阻塞了很多的請求,

         而應用服務器對每個請求也是比較快的,看來是請求數太高導致需要排隊等待,響應速度變慢。

    特征:多台服務器通過負載均衡同時向外部提供服務,解決單台服務器處理能力和存儲空間上限的問題。

    描述:使用集群是系統解決高並發、海量數據問題的常用手段。通過向集群中追加資源,提升系統的並發處理能力,使得服務器的負載壓力不再成為整個系統的瓶頸。

  

  (5)數據庫讀寫分離

     

     說明:享受了一段時間的系統訪問量高速增長的幸福后,發現系統又開始變慢了,這次又是什么狀況呢,

        經過查找,發現數據庫寫入、更新的這些操作的部分數據庫連接的資源競爭非常激烈,導致了系統變慢

     特征:多台服務器通過負載均衡同時向外部提供服務,解決單台服務器處理能力和存儲空間上限的問題。

     描述:使用集群是系統解決高並發、海量數據問題的常用手段。通過向集群中追加資源,使得服務器的負載壓力不在成為整個系統的瓶頸。

 

  (6)反向代理和CDN加速 

     

    特征:采用CDN和反向代理加快系統的訪問速度。

    描述:為了應付復雜的網絡環境和不同地區用戶的訪問,通過CDN和反向代理加快用戶訪問的速度,同時減輕后端服務器的負載壓力。CDN與反向代理的基本原理都是緩存

 

  (7)“分布式文件”系統 和 “分布式數據庫

      

    說明:隨着系統的不斷運行,數據量開始大幅度增長,這個時候發現分庫后查詢仍然會有些慢,於是按照分庫的思想開始做分表的工作

    特征:數據庫采用分布式數據庫,文件系統采用分布式文件系統。

    描述:任何強大的單一服務器都滿足不了大型系統持續增長的業務需求,數據庫讀寫分離隨着業務的發展最終也將無法滿足需求,需要使用分布式數據庫及分布式文件系統來支撐。
         分布式數據庫是系統數據庫拆分的最后方法,只有在單表數據規模非常龐大的時候才使用,更常用的數據庫拆分手段是業務分庫,將不同的業務數據庫部署在不同的物理服務器上。

 

  (8)使用NoSQL和搜索引擎     

     

    特征:系統引NoSQL數據庫搜索引擎

    描述:隨着業務越來越復雜,對數據存儲和檢索的需求也越來越復雜,系統需要采用一些非關系型數據庫如NoSQL和分數據庫查詢技術如搜索引擎。

         應用服務器通過統一數據訪問模塊訪問各種數據,減輕應用程序管理諸多數據源的麻煩。

   (9)業務拆分

     

    特征:系統上按照業務進行拆分改造,應用服務器按照業務區分進行分別部署。

    描述:為了應對日益復雜的業務場景,通常使用分而治之的手段將整個系統業務分成不同的產品線,應用之間通過超鏈接建立關系,也可以通過消息隊列進行數據分發,

        當然更多的還是通過訪問同一個數據存儲系統來構成一個關聯的完整系統。

    縱向拆分:將一個大應用拆分為多個小應用,如果新業務較為獨立,那么就直接將其設計部署為一個獨立的Web應用系統 縱向拆分相對較為簡單,通過梳理業務,將較少相關的業務剝離即可。

    橫向拆分:將復用的業務拆分出來,獨立部署為分布式服務,新增業務只需要調用這些分布式服務 橫向拆分需要識別可復用的業務,設計服務接口,規范服務依賴關系。

 

   (10)分布式服務

     

    特征:公共的應用模塊被提取出來,部署在分布式服務器上供應用服務器調用。

    描述:隨着業務越拆越小,應用系統整體復雜程度呈指數級上升,由於所有應用要和所有數據庫系統連接,最終導致數據庫連接資源不足,拒絕服務。

 

五、分布式服務應用會面臨哪些問題?

  (1) 當服務越來越多時,服務URL配置管理變得非常困難,F5硬件負載均衡器的單點壓力也越來越大。
  (2) 當進一步發展,服務間依賴關系變得錯蹤復雜,甚至分不清哪個應用要在哪個應用之前啟動,架構師都不能完整的描述應用的架構關系。
  (3) 接着,服務的調用量越來越大,服務的容量問題就暴露出來,這個服務需要多少機器支撐?什么時候該加機器?
  (4) 服務多了,溝通成本也開始上升,調某個服務失敗該找誰?服務的參數都有什么約定? 
  (5) 一個服務有多個業務消費者,如何確保服務質量?
  (6) 隨着服務的不停升級,總有些意想不到的事發生,比如cache寫錯了導致內存溢出,故障不可避免,每次核心服務一掛,影響一大片,人心慌慌,如何控制故障的影響面?服務是否可以功能降級?或者資源劣化? 

 

參考資料:

  億級Web系統搭建——單機到分布式集群:http://kb.cnblogs.com/page/509402/

  網站架構 http://www.cnblogs.com/itfly8/tag/%E7%BD%91%E7%AB%99%E6%9E%B6%E6%9E%84/#undefined

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM