到底什么是分布式系統？你需要了解這些

本文轉載自查看原文 2020-09-09 15:45 745 程序員之家

摘要：什么是分布式系統？為什么要用分布式系統？分布式系統如何分布？這些你知道嗎？

小引

分布式系統是一個古老而寬泛的話題，而近幾年因為 “大數據” 概念的興起，又煥發出了新的青春與活力。本文將會通過對如下幾個問題展開談一下分布式系統：

 什么是分布式系統？

 為什么要用分布式系統？

 分布式系統設計推演

 CAP定理是什么？

 分布式系統如何進行分布？

 分布式應用通常使用的架構類型哪些?

 分布式系統的優缺點有哪些？

1. 什么是分布式系統？

簡單的來說，一個分布式系統是一組計算機系統一起工作，在終端用戶看來，就像一台計算機在工作一樣。

這組一起工作的計算機，擁有共享的狀態，他們同時運行，獨立機器的故障不會影響整個系統的正常運行。

我們現在舉個例子，傳統的數據庫是存儲在一台機器的文件系統上的。每當我們取出或者插入信息的時候，我們直接和那台機器進行交互。

那么現在我們把這個傳統的數據庫設計成分布式數據庫。假設我們使用了三台機器來構建這台分布式數據庫，我們追求的結果是，在機器1上插入一條記錄，需要在機器3上可以返回那條記錄，當然了，機器1和2也要能夠返回這條記錄。

2. 為什么要用分布式系統？

管理分布式系統是一個非常復雜的話題，里面充滿了陷阱和地雷。部署維護和調試分布式系統也是非常頭疼的一件事情，那為什么還要去做呢？

分布式系統最大的好處就是能夠讓你橫向的擴展系統。

以前面提到的單一數據庫為例，能夠處理更多流量的唯一方式就是升級數據庫運行的硬件，這就是縱向擴展。

而縱向擴展的是有局限性的。當到了一定程度以后，我們會發現即使最好的硬件，也不能夠滿足當前流量的需求。

橫向擴展是指通過增加更多的機器來提升整個系統的性能，而不是靠升級單台計算機的硬件。

從價格上來說，橫向擴展相比縱向擴展更容易控制。

最根本的問題是縱向擴展有很強的局限性，達到最新硬件的能力以后，還是無法滿足中等或者大型工作負載的技術要求。

橫向擴展則沒有這個限制，它沒有上限，每當性能下降的時候，你就需要增加一台機器，這樣理論上講可以達到無限大的工作負載支持。

除此之外，在容錯和低延遲上也有很多優勢。容錯性是指你的分布式系統的某個節點出現錯誤以后，並不會導致整個系統的癱瘓。而單機系統出錯以后，可能會導致整個系統的崩潰。

低延遲是通過在不同的物理位置部署不同的機器，通過就近獲取的原則降低訪問的延遲時間。

上面討論了分布式系統的種種好處，但是我們必須要清楚設計和運行分布式系統並非易事。

3. 分布式系統設計推演

我們先講一個場景，我們現有的網絡應用變得越來越流行，服務的人數也越來越多，導致我們的應用程序每秒收到的請求，遠遠超過能夠正常處理的數量。這會導致應用程序性能下降明顯，用戶也會注意到這一點。

那我們下面就來擴展一下我們的應用程序來滿足更高的要求。一般來說我們讀取信息的頻率要遠遠超過插入或者修改的頻率。

下面我們使用主從復制策略來實現擴展系統。我們可以創建兩個新的數據庫服務器，他們與主服務器同步。用戶業務對這兩個新的數據庫只能讀取。每次當向主數據庫插入和修改信息時，都會異步的通知副本數據庫進行更新變化。

在這一步上我們已經有了三倍於原來系統讀取數據的性能支持。但是這里有一個問題，在數據庫事務的設計當中，我們遵循ACID原則。但是在我們同時對其他兩個數據庫進行數據更新的時候，我們有一個時間窗口失去了一致性原則。如果在這個時間窗口內對兩個新的數據庫進行查詢，可能查不到數據。這個時候如果同步這三個數據庫的數據，就會影響寫操作的性能。

這是我們在設計分布式系統的時候，不得不承受的一些代價。

上面的主從復制策略解決了用戶讀取性能方面的需求，但是當數據量達到一定程度，一台機子上無法存放的時候，我們需要擴展寫操作性能。要解決這樣的問題，我們可以使用分區技術。分區技術是指根據特定的算法，比如用戶名a到z作為不同的分區，分別指向不同的數據庫寫入，每個寫入數據庫會有若干讀取的從數據庫進行同步提升讀取性能。

當然，這樣使得整套系統變得更加復雜。最重要的難點是分區算法。你們試想一下，如果c開頭的用戶名比其他開頭的用戶名要多很多，這會導致c區的數據量非常龐大，相應地，對於c區的請求也會遠遠大於其他區。此時c區成為熱點。要避免熱點，需要對c區進行拆分。此時要進行共享數據就會變得非常昂貴，甚至可能導致停機。

如果一切都很理想，那我們就擁有了 n倍的寫入流量，n是分區的數目。

當然這里也存在一個陷阱，我們進行數據分區以后，導致除了分區鍵以外的查詢都變得非常低效，尤其是對於sql語句如join查詢就變得非常之糟糕，導致一些復雜的查詢根本無法使用。

這里有一個思考題:

如何選擇更好的分區策略算法？

4. CAP定理是什么？

這個定理是指一個分布式系統不能同時具有一致性，可用性和分區容忍性。

一致性Consistency: 依次讀寫的是什么就是什么。

可用性Availability: 整個系統不會崩潰, 每個非故障節點總會有一個相應。

分區容忍Partition tolerant: 盡管有分區，系統仍能繼續運行並保持其一致性和可用性。

對於任何分布式系統來說，分區容忍是一個給定的條件，如果沒有這一點，就不可能做到一致性和可用性。試想如果兩個節點鏈接斷掉了，他們如何能夠做到既可用又一致?

最后你只能選擇在網絡分區情況下，你的系統要么強一致，要么高可用。

實踐表明大多數應用程序更看重可用性。這個考量的主要原因是在不得不同步機器里實現強於一致性是時，網絡延遲會成為一個問題。

這類因素使得應用程序通常會選擇提供高可用性的解決方案。

此時采用的是最弱的一致性模型來解決的，這種模型保證了如果沒有對某個項目進行新的更新，最終對該項目的所有訪問都會返回最新的值。

這些系統提供了BASE屬性，這是相對於傳統數據庫的ACID來講的。也就是( Basically available)基本上是可用的，系統總會返回一個響應。

( Soft state)軟狀態, 系統可以隨着時間的推移而變化，甚至在沒有輸入的情況下也可以變化, 如保持最終的一致性的同步。

( Eventual consistency)最終的一致性, 在沒有輸入的情況下，數據遲早會傳播到每一個節點上，從而變得一致。

追求高可用的分布式數據庫例子有Cassandra；看重強一致性的數據庫，有HBase， Redis， Zookeeper。

5. 分布式系統如何進行分布？

我們來看一下分布系統進行分布的常用方式：

1. 哈希

以哈希方式把不同的值進行哈希運算，映射到不同的機器或者節點上。這種方式在擴展的時候比較困難，因為數據分散在多個機器上很容易出現分布不均的情況，常見的哈希對象有ip，url，id等。

2. 數據范圍

按數據范圍分布，比如ID在1~100的在機器a上，ID在100~200的在機器b上，諸如此類。這種分布方法數據比較均勻。如果某個節點處理能力有限，可以直接分裂這個節點。

維護數據分布的這些原數據，如果量非常大的話，可能會出現單點瓶頸。

因此一定要嚴格控制元數據量。

3. 數據量

按數據量來分布數據，是以較為固定的大小將數據划分為若干的數據塊，再把不同的數據塊分布到不同的服務器上。

以數據量來進行分布的這些數據，也需要被記錄下來作為元數據來管理。

當集群規模很大時，元數據的量也會變大。

4. 副本與數據分布

這種方式是指把數據給分散到多個服務器上。如果其中一台出現問題，請求就會被轉到其他服務器上。其原理是多個機器互為副本，這是比較理想的實現負載分壓的方式。

5. 一致性哈希

一致性哈希。通過哈希域構造哈希環，在增加機器時，變動的是其附近的節點，分攤的是附近節點的壓力，其元數據的維護和按數量分布的維護方式一致。

我們現在來看一下使用以上方式進行分布的例子:

GFS, HDFS: 按數據量分布。

Map reduce: 按GFS數據分布做本地化。

BigTable, HBase按數據范圍分布。

Pnuts: 按哈希方式或者數據范圍分布。

Dynamo, Cassndra: 按一致性哈希分布。

Mola, Armor, BigPipe: 按哈希方式分布。

Doris: 按哈希方式和按數據量分布進行組合。

6. 分布式應用通常使用的架構類型哪些?

6.1 客戶端服務器

在這個類型中，分布式系統架構有一個服務器作為共享資源。比如打印機數據庫或者網絡服務器。它有多個客戶機，這些客戶機決定何時使用共享資源，如何使用和顯示改變數據，並將其送回服務器，像git這樣的代碼倉，這是一個很好的例子。

6.2 三層架構

這種架構把系統分為表現層，邏輯層和數據層，這簡化了應用程序的部署，大部分早期的網絡應用都是三層的。

6.3 多層架構

上面的三層架構是多層架構的一種特殊形式。

一般會把上面的三層進行更詳細的划分，比如說以業務的形式進行分層。

6.4 點對點架構

在這種架構中，沒有專門的機器提供服務或管理網絡資源。而是將責任統一分配給所有的機器，成為對等機，對等機既可以作為客戶機，也可以作為服務器。這種架構的例子，包括bittorrent和區塊鏈。

6.5 以數據庫為中心

這種架構是指用一個共享的數據庫，使分布式的各個節點在不需要任何形式直接通信的情況下，進行協同工作的架構。

7. 分布式系統的優缺點有哪些？

7.1分布式系統的優點

1. 分布式系統中的所有節點都是相互連接的。所以節點可以很容易地與其他節點共享數據。

2. 更多的節點可以很容易地添加到分布式系統中，即可以根據需要進行擴展。

3. 一個節點的故障不會導致整個分布式系統的失敗。其他節點仍然可以相互通信。

4. 硬件資源可以與多個節點共享，而不是只限於一個節點。

7.2分布式系統的缺點

1. 在分布式系統中很難提供足夠的安全，因為節點以及連接都需要安全。

2. 一些消息和數據在從一個節點轉移到另一個節點時，可能會在網絡中丟失。

3. 與單用戶系統相比，連接到分布式系統的數據庫是相當復雜和難以處理的。

4. 如果分布式系統的所有節點都試圖同時發送數據，網絡中可能會出現過載現象。

小結

最后談一下分布式系統與集群的關聯。我的觀點是這兩者並不是對立的。

因為分布式系統是通過多個節點的集群來完成一個任務，讓外界看起來是跟一套系統作為一個整體打交道。

一套分布式系統可以有多個集群，這些集群可以業務進行划分，也可以物理區域進行划分。每一個集群可以作為這個分布式系統的一個節點。

這些集群節點組成的分布式系統，又可以作為單個的節點與其他的節點組成一個集群。

點擊關注，第一時間了解華為雲新鮮技術~

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 什么是分布式系統分布式系列：什么是分布式系統1 分布式系統的完整介紹（二）分布式系統-單點登錄分布式系統整理分布式系統基礎總結分布式系統之CAP原理為什么使用分布式系統分布式系統之CAP理論分布式系統設計(1)