集群Cluster介紹


來源:http://www.ibm.com/developerworks/cn/linux/cluster/lw-clustering.html
簡單的說,集群(cluster)就是一組計算機,它們作為一個整體向用戶提供一組網絡資源。這些單個的計算機系統就是集群的節點(node)。一個理想的集群是,用戶從來不會意識到集群系統底層的節點,在他/她們看來,集群是一個系統,而非多個計算機系統。並且集群系統的管理員可以隨意增加和刪改集群系統的節點。
集群並不是一個全新的概念,其實早在七十年代計算機廠商和研究機構就開始了對集群系統的研究和開發。由於主要用於科學工程計算,所以這些系統並不為大家所熟知。直到Linux集群的出現,集群的概念才得以廣為傳播。集群系統主要分為高可用(High Availability)集群,簡稱 HA 集群,和高性能計算(High Perfermance Computing)集群,簡稱 HPC 集群。
集群系統(Cluster)主要解決下面幾個問題:
   1. 高可靠性(HA)。利用集群管理軟件,當主服務器故障時,備份服務器能夠自動接管主服務器的工作,並及時切換過去,以實現對用戶的不間斷服務。
   2. 高性能計算(HP)。即充分利用集群中的每一台計算機的資源,實現復雜運算的並行處理,通常用於科學計算領域,比如基因分析,化學分析等。
   3. 負載平衡。即把負載壓力根據某種算法合理分配到集群中的每一台計算機上,以減輕主服務器的壓力,降低對主服務器的硬件和軟件要求。
科學群集
通常,第一種涉及為群集開發並行編程應用程序,以解決復雜的科學問題。這是並行計算的基礎,盡管它不使用專門的並行超級計算機,這種超級計算機內部由十至上萬個獨立處理器組成。但它卻使用商業系統,如通過高速連接來鏈接的一組單處理器或雙處理器 PC,並且在公共消息傳遞層上進行通信以運行並行應用程序。因此,您會常常聽說又有一種便宜的 Linux 超級計算機問世了。但它實際是一個計算機群集,其處理能力與真的超級計算機相等,通常一套象樣的群集配置開銷要超過 $100,000。這對一般人來說似乎是太貴了,但與價值上百萬美元的專用超級計算機相比還算是便宜的。
負載均衡群集
負載均衡群集為企業需求提供了更實用的系統。如名稱所暗示的,該系統使負載可以在計算機群集中盡可能平均地分攤處理。該負載可能是需要均衡的應用程序處理負載或網絡流量負載。這樣的系統非常適合於運行同一組應用程序的大量用戶。每個節點都可以處理一部分負載,並且可以在節點之間動態分配負載,以實現平衡。對於網絡流量也是如此。通常,網絡服務器應用程序接受了太多入網流量,以致無法迅速處理,這就需要將流量發送給在其它節點上運行的網絡服務器應用。還可以根據每個節點上不同的可用資源或網絡的特殊環境來進行優化。
高可用性群集
高可用性群集的出現是為了使群集的整體服務盡可能可用,以便考慮計算硬件和軟件的易錯性。如果高可用性群集中的主節點發生了故障,那么這段時間內將由次節點代替它。次節點通常是主節點的鏡像,所以當它代替主節點時,它可以完全接管其身份,並且因此使系統環境對於用戶是一致的。
在群集的這三種基本類型之間,經常會發生混合與交雜。於是,可以發現高可用性群集也可以在其節點之間均衡用戶負載,同時仍試圖維持高可用性程度。同樣,可以從要編入應用程序的群集中找到一個並行群集,它可以在節點之間執行負載均衡。盡管集群系統本身獨立於它在使用的軟件或硬件,但要有效運行系統時,硬件連接將起關鍵作用。
Microsoft Windows 2003集群介紹
    服務器群集是一組協同工作並運行Microsoft群集服務(Microsoft Cluster Service,MSCS)的獨立服務器。服務器群集為資源和應用程序提供高可用性、故障恢復、可伸縮性和可管理性。
    服務器群集允許客戶端在出現故障和計划中的暫停時,依然能夠訪問應用程序和資源。如果群集中的某一台服務器由於故障或維護需要而無法使用,資源和應用程序將轉移到可用的群集節點上。
    Windows群集(Windows Clustering)解決方案使用了名詞“高可用性”而非“容錯”。容錯技術提供更高層次的彈性和恢復能力。容錯服務器通常使用深層硬件冗余,加上專門的軟件,幾乎可以即時地恢復任何單一的硬件或軟件錯誤。這些解決方案要比Windows群集(Windows Clustering)解決方案昂貴得多,因為組織必須為處於空閑狀態等待錯誤的冗余硬件支付費用。
    服務器群集無法保證無間斷運作,但是確實能夠為多數關鍵任務應用程序提供足夠的可用性。群集服務可以對應用程序和資源進行監控,並能夠自動識別和恢復眾多故障狀況。這為在群集中管理工作負荷提供了靈活性。另外,還提高了整個系統的可用性。
群集服務(Cluster service)的優點包括:
    • 高可用性:通過服務器群集,資源(例如:磁盤驅動器和Internet協議(IP)地址)的所有權會自動從故障服務器轉移到可用的服務器。當群集中的某個系統或應用程序發生故障時,群集軟件會在可用的服務器上重新啟動故障應用程序,或者將工作從故障節點分散到剩下的節點上。由此,用戶只在瞬間感覺到服務的暫停。
    • 故障恢復:當故障服務器重新回到其預定的首選所有者的聯機狀態時,群集服務將自動在群集中重新分配工作負荷。該特性可配置,但默認禁用。
    • 可管理性:您可以使用“群集管理器”工具(CluAdmin.exe),將群集作為一個單一的系統進行管理,並對猶如運行於一個單一服務器的應用程序實施管理。您可以將應用程序轉移到群集中的其它服務器。“群集管理器”可用於手動平衡服務器的工作負荷,並針對計划維護釋放服務器。您還可以監控群集的狀態、所有節點以及來自網絡任何地方的資源。
    • 可伸縮性:群集服務可擴展以滿足需求的增長。當群集監督應用程序的總體負荷超出了群集的能力范圍時,可以添加附加的節點。 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM