上節課我們小組對淘寶網進行了簡要的架構分析,這周我在課余時間對這類大型電商網站的某些具體架構技術進行了梳理和概括,並對一些架構方法進行更深層次的介紹,並且結合軟件工程進行典型電商的需求分析。
一、典型電商案例
電商網站:比如阿里巴巴,京東商城,國美在線,汽車之家等。大型門戶一般是新聞類信息,可以使用CDN,靜態化等方式優化,一些交互性比較多的網站,可能會引入更多的NOSQL,分布式緩存,使用高性能的通信框架等。電商網站具備以上兩類的特點,比如產品詳情可以采用CDN,靜態化,交互性高的需要采用NOSQL等技術。因此,我們采用電商網站作為案例,進行分析。
二、電商網站需求
客戶需求:
- 建立一個全品類的電子商務網站(B2C),用戶可以在線購買商品,可以在線支付,也可以貨到付款;
- 用戶購買時可以在線與客服溝通;
- 用戶收到商品后,可以給商品打分,評價;
- 目前有成熟的進銷存系統;需要與網站對接;
- 希望能夠支持3~5年,業務的發展;
- 預計3~5年用戶數達到1000萬;
- 定期舉辦雙11,雙12,三八男人節等活動;
- 其他的功能參考京東或國美在線等網站。
這里介紹一下需求功能矩陣
需求功能矩陣是一種十分全面的需求分析方法,它不會漏掉一些用傳統需求管理方法容易漏掉的肺功能需求,因此推薦大家使用需求功能矩陣,進行需求描述。
一個典型電商網站的需求矩陣如下:
網站需求 | 功能需求 | 非功能需求 |
全品類的電子商務網站 | 分類管理,商品管理 | 方便進行多品類管理(靈活性)網站訪問速度要快(高性能)圖片存儲的要求(海量小圖片) |
用戶可以在線購買商品 | 會員管理,購物車,結算功能 | 良好購物體驗(可用性,性能) |
在線支付或貨到付款 | 多種在線支付方式 | 支付過程要安全,數據加密(安全性)多種支付接口靈活切換(靈活性,擴展性) |
可以在線與客服溝通 | 在線客服功能 | 可靠性:即時通訊 |
商品打分評價 | 商品評論 | |
目前有成熟的進銷存系統 | 對接進銷存 | 屬於約束條件對接時要考慮數據一致性,魯棒性 |
支持3~5年,業務的發展 | 屬於約束條件伸縮性,可擴展性 | |
3~5年用戶數達到1000萬 | 約束條件 | |
舉辦雙11,雙12,三八男人節等活動 | 活動管理,秒殺 | 突增訪問流量(可伸縮)實時性要求(高性能) |
參考京東或國美在線 | 參考條件 |
以上是對電商網站需求的簡單舉例,目的是說明(1)需求分析的時候,要全面,大型分布式系統重點考慮非功能需求;(2)描述一個簡單的電商需求場景,使大家對下一步的分析設計有個依據。
三、網站架構
上次我們小組博客的分析已經把最初的網站架構進行了介紹。隨着目前網站用戶量的激增,目前主流的網站架構已經發生了翻天覆地的變化。一般都會采用集群的方式,通過服務器集群之間的通信提高可訪問數據量和保證訪問的速度。
使用集群對應用服務器進行冗余,實現高可用;
使用數據庫主備模式,實現數據備份和高可用;
四、系統容量預估
預估步驟:
- 注冊用戶數-日均UV量-每日的PV量-每天的並發量;
- 峰值預估:平常量的2~3倍;
- 根據並發量(並發,事務數),存儲容量計算系統容量。
(系統預估必須結合客戶需求)
訪問原則:20/80原則(上次已經介紹過)
容量預估:70/90原則:系統CPU一般維持在70%左右的水平,高峰期達到90%的水平,是不浪費資源,並比較穩定的。內存,IO類似。
以上預估僅供參考,因為服務器配置,業務邏輯復雜度等都有影響。在此CPU,硬盤,網絡等不再進行評估。
五、網站架構優化
上次我們組介紹了反向代理CDN,多級緩存等優化技術,這次我們繼續介紹一些典型的網站架構優化方法。
1.業務拆分
根據業務屬性進行垂直切分,划分為產品子系統,購物子系統,支付子系統,評論子系統,客服子系統,接口子系統(對接如進銷存,短信等外部系統)。
根據業務子系統進行等級定義,可分為核心系統和非核心系統。核心系統:產品子系統,購物子系統,支付子系統;非核心:評論子系統,客服子系統,接口子系統。
業務拆分作用:提升為子系統可由專門的團隊和部門負責,專業的人做專業的事,解決模塊之間耦合以及擴展性問題;每個子系統單獨部署,避免集中部署導致一個應用掛了,全部應用不可用的問題。
等級定義作用:用於流量突發時,對關鍵應用進行保護,實現優雅降級;保護關鍵應用不受到影響。
拆分后的架構圖:
2.應用集群部署(分布式,集群,負載均衡)
分布式部署:將業務拆分后的應用單獨部署,應用直接通過RPC進行遠程通信;
集群部署:電商網站的高可用要求,每個應用至少部署兩台服務器進行集群部署;
負載均衡:是高可用系統必須的,一般應用通過負載均衡實現高可用,分布式服務通過內置的負載均衡實現高可用,關系型數據庫通過主備方式實現高可用。
集群部署后架構圖:
3.多級緩存
緩存按照存放的位置一般可分為兩類本地緩存和分布式緩存。本案例采用二級緩存的方式,進行緩存的設計。一級緩存為本地緩存,二級緩存為分布式緩存。(還有頁面緩存,片段緩存等,那是更細粒度的划分)
一級緩存,緩存數據字典,和常用熱點數據等基本不可變/有規則變化的信息,二級緩存緩存需要的所有緩存。當一級緩存過期或不可用時,訪問二級緩存的數據。如果二級緩存也沒有,則訪問數據庫。
緩存的比例,一般1:4,即可考慮使用緩存。(理論上是1:2即可)。
根據業務特性可使用以下緩存過期策略:
- 緩存自動過期;
- 緩存觸發過期;
4.單點登錄(分布式Session)
系統分割為多個子系統,獨立部署后,不可避免的會遇到會話管理的問題。一般可采用Session同步,Cookies,分布式Session方式。電商網站一般采用分布式Session實現。
再進一步可以根據分布式Session,建立完善的單點登錄或賬戶管理系統。
流程說明
- 用戶第一次登錄時,將會話信息(用戶Id和用戶信息),比如以用戶Id為Key,寫入分布式Session;
- 用戶再次登錄時,獲取分布式Session,是否有會話信息,如果沒有則調到登錄頁;
- 一般采用Cache中間件實現,建議使用Redis,因此它有持久化功能,方便分布式Session宕機后,可以從持久化存儲中加載會話信息;
- 存入會話時,可以設置會話保持的時間,比如15分鍾,超過后自動超時;
結合Cache中間件,實現的分布式Session,可以很好的模擬Session會話。
5.數據庫集群(讀寫分離,分庫分表)
大型網站需要存儲海量的數據,為達到海量數據存儲,高可用,高性能一般采用冗余的方式進行系統設計。一般有兩種方式讀寫分離和分庫分表。
讀寫分離:一般解決讀比例遠大於寫比例的場景,可采用一主一備,一主多備或多主多備方式。
本案例在業務拆分的基礎上,結合分庫分表和讀寫分離。如下圖:
- 業務拆分后:每個子系統需要單獨的庫;
- 如果單獨的庫太大,可以根據業務特性,進行再次分庫,比如商品分類庫,產品庫;
- 分庫后,如果表中有數據量很大的,則進行分表,一般可以按照Id,時間等進行分表;(高級的用法是一致性Hash)
- 在分庫,分表的基礎上,進行讀寫分離;
相關中間件可參考Cobar(阿里,目前已不在維護),TDDL(阿里),Atlas(奇虎360),MyCat(在Cobar基礎上,國內很多牛人,號稱國內第一開源項目)。
分庫分表后序列的問題,JOIN,事務的問題,會在分庫分表主題分享中,介紹。
6.服務化
將多個子系統公用的功能/模塊,進行抽取,作為公用服務使用。比如本案例的會員子系統就可以抽取為公用的服務。
7.消息隊列
消息隊列可以解決子系統/模塊之間的耦合,實現異步,高可用,高性能的系統。是分布式系統的標准配置。本案例中,消息隊列主要應用在購物,配送環節。
- 用戶下單后,寫入消息隊列,后直接返回客戶端;
- 庫存子系統:讀取消息隊列信息,完成減庫存;
- 配送子系統:讀取消息隊列信息,進行配送;
目前使用較多的MQ有Active MQ,Rabbit MQ,Zero MQ,MS MQ等,需要根據具體的業務場景進行選擇。建議可以研究下Rabbit MQ。
六、架構總結