作者:13
GitHub:https://github.com/ZHENFENG13
版權聲明:本文為原創文章,未經允許不得轉載。
此篇已收錄至《大型網站技術架構:核心原理與案例分析》讀書筆記系列,點擊訪問該目錄獲取完整內容。
前言
模式:每一個模式描述了一個在我們周圍不斷重復發生的問題及該問題解決方案的核心。這樣,你就能一次又一次地使用該方案而不必做重復工作。
網站架構模式:大型互聯網公司在實踐中提出了許多解決方案,以實現網站高性能、高可用、易伸縮、可擴展、安全等各種技術框架目標。這些解決方案又被更多網站重復使用,從而逐漸形成大型網站架構模式。
所謂網站架構模式即為了解決大型網站面臨的高並發訪問、海量數據、高可靠運行燈一系列問題與挑戰,為此,在實踐中提出了許多解決方案,以實現網站高性能、高可靠性、易伸縮、可擴展、安全等各種技術架構目標。
分層
分層是企業應用系統中最常見的一種架構模式,將系統在橫向維度上切分成幾個部分,每個部分負責一部分相對簡單並比較單一的職責,然后通過上層對下層的依賴和調度組成一個完整的系統。
ssm-demo結構圖:
在網站的分層架構中,常見的為3層,即應用層、服務層、數據層。
應用層具體負責業務和視圖的展示;服務層為應用層提供服務支持;數據庫提供數據存儲訪問服務,如數據庫、緩存、文件、搜索引擎等。
分層架構是邏輯上的,在物理部署上,三層架構可以部署在同一個物理機器上,但是隨着網站業務的發展,必然需要對已經分層的模塊分離部署,即三層結構分別部署在不同的服務器上,是網站擁有更多的計算資源以應對越來越多的用戶訪問。
所以雖然分層架構模式最初的目的是規划軟件清晰的邏輯結構以便於開發維護,但在網站的發展過程中,分層結構對網站支持高並發向分布式方向的發展至關重要。
分隔
如果說分層是將軟件在橫向方面進行切分,那么分隔就是在縱向方面對軟件進行切分。
網站越大,功能越復雜,服務和數據處理的種類也越多,將這些不同的功能和服務分隔開來,包裝成高內聚低耦合的模塊單元,不僅有助於軟件的開發維護也便於不同模塊的分布式部署,提高網站的並發處理能力和功能擴展能力。
大型網站分隔的粒度可能會很小。比如在應用層,將不同業務進行分隔,例如將購物、論壇、搜索、廣告分隔成不同的應用,有對立的團隊負責,部署在不同的服務器上。
分布式
對於大型網站,分層和分隔的一個主要目的是為了切分后的模塊便於分布式部署,即將不同模塊部署在不同的服務器上,通過遠程調用協同工作。分布式意味着可以使用更多的計算機完同樣的工作,計算機越多,CPU、內存、存儲資源就越多,能過處理的並發訪問和數據量就越大,進而能夠為更多的用戶提供服務。
在網站應用中,常用的分布式方案有一下幾種:
-
分布式應用和服務:將分層和分隔后的應用和服務模塊分布式部署,可以改善網站性能和並發性、加快開發和發布速度、減少數據庫連接資源消耗。
-
分布式靜態資源:網站的靜態資源如JS、CSS、Logo圖片等資源對立分布式部署,並采用獨立的域名,即人們常說的動靜分離。靜態資源分布式部署可以減輕應用服務器的負載壓力;通過使用獨立域名加快瀏覽器並發加載的速度。
-
分布式數據和存儲:大型網站需要處理以P為單位的海量數據,單台計算機無法提供如此大的存儲空間,這些數據庫需要分布式存儲。
-
分布式計算:目前網站普遍使用Hadoop和MapReduce分布式計算框架進行此類批處理計算,其特點是移動計算而不是移動數據,將計算程序分發到數據所在的位置以加速計算和分布式計算。
集群
對於用戶訪問集中的模塊需要將獨立部署的服務器集群化,即多台服務器部署相同的應用構成一個集群,通過負載均衡設備共同對外提供服務。
服務器集群能夠為相同的服務提供更多的並發支持,因此當有更多的用戶訪問時,只需要向集群中加入新的機器即可;
另外可以實現當其中的某台服務器發生故障時,可以通過負載均衡的失效轉移機制將請求轉移至集群中其他的服務器上,因此可以提高系統的可用性。
緩存
緩存目的就是減輕服務器的計算,使數據直接返回給用戶。
在現在的軟件設計中,緩存已經無處不在。
具體實現有CDN、反向代理、本地緩存、分布式緩存等。
使用緩存有兩個條件:訪問數據熱點不均衡,即某些頻繁訪問的數據需要放在緩存中;
數據在某個時間段內有效,不過很快過期,否在會因為數據過期而臟讀,影響數據的正確性。
異步
使用異步,業務之間的消息傳遞不是同步調用,而是將一個業務操作分成多個階段,每個階段之間通過共享數據的方法異步執行進行協作。
具體實現則在單一服務器內部可用通過多線程共享內存對了的方式處理;在分布式系統中可用通過分布式消息隊列來實現異步。
異步架構的典型就是生產者消費者方式,兩者不存在直接調用。
冗余
網站需要7×24小時連續運行,那么就得有相應的冗余機制,以防某台機器宕掉時無法訪問,而冗余則可以通過部署至少兩台服務器構成一個集群實現服務高可用。
數據庫除了定期備份還需要實現冷熱備份,甚至可以在全球范圍內部署災備數據中心。
水至清則無魚嘛。
自動化
具體有自動化發布過程,自動化代碼管理、自動化測試、自動化安全檢測、自動化部署、自動化監控、自動化報警、自動化失效轉移、自動化失效恢復等。
安全
網站在安全架構方面有許多模式:
- 通過密碼和手機校驗碼進行身份認證;
- 登錄、交易需要對網絡通信進行加密;
- 為了防止機器人程序濫用資源,需要使用驗證碼進行識別;
- 對常見的XSS攻擊、SQL注入需要編碼轉換;垃圾信息需要過濾等。
我的小網站從上線之初到現在也被攻擊了好幾次了,真的是無奈,就是一個為初學者演示的demo,你皮這一下之后很有成就感嗎?
結語
首發於我的個人博客.
以前嘛,看書基本都是看看熱鬧,現在的話,就會有更多自己的思考了,吃一塹長一智,雖然前人已經通過各種方式告知我們一些事情,但是很多錯依然會犯,只有痛了才知道。