淺析阿里 OceanBase 雙十一淘寶天貓天量交易承載能力原理

本文轉載自查看原文 2019-01-02 15:07 736

我們先看看這 2 篇文章：

《秘訣！支付寶支撐雙十一4200萬次/秒的數據庫請求峰值的技術實現》 https://mp.weixin.qq.com/s?__biz=MzI3MzEzMDI1OQ==&mid=2651820306&idx=1&sn=6220b250d8970822e8c63a49fc1c4442&chksm=f0dcc76ec7ab4e782a683c4532304eb75cef2d8f24fa9abcdc692e865a97e7fd0d145ee0452f&mpshare=1&scene=1&srcid=05110uUhHlasVkvsuwF1pZsd&pass_ticket=lfqxD4r1E1dgDxTqGUsQTSjApCKuffPi3swo8QNXfC9dq3nzpLHNpn4f7IJMM42n#rd

《螞蟻金服CTO程立：金融級分布式交易的技術路徑》 https://mp.weixin.qq.com/s?__biz=MzI3MzEzMDI1OQ==&mid=2651820298&idx=1&sn=e01179f16295ac1fddc3c33696845fe4&chksm=f0dcc776c7ab4e604e1d7d3171708a40331e1e0dce100579026df9b4365be1f7af0e37da5e0a&mpshare=1&scene=1&srcid=0509JF8HPfpgyAQL3orPFGXq&pass_ticket=lfqxD4r1E1dgDxTqGUsQTSjApCKuffPi3swo8QNXfC9dq3nzpLHNpn4f7IJMM42n#rd

我之前也寫過 2 篇文章：

《海量並發下的系統架構和數據庫發展之路》 https://www.cnblogs.com/KSongKing/p/9937135.html

《論大並發下的樂觀鎖定 Redis鎖定和新時代事務》 https://www.cnblogs.com/KSongKing/p/9934722.html

阿里的 OceanBase 高速的數據處理和應對大並發的能力的基礎是內存計算，即在內存里對數據進行計算，而不是在計算時頻繁的讀寫外部存儲器。

對於事務（Transaction）， OceanBase 應該不會把事物日志寫到外部存儲器（磁盤固態硬盤），而是寫入多個服務器節點的內存，

通過多節點來實現可靠性。比如要超過 2/3 的節點正常的寫入了事務日志，才會開始事務。

這同樣是為了提升速度，事務日志如果寫入外部存儲器的話，時間上來不及，對天量交易來說太慢了。

從內存計算這一點來看， OceanBase 和 12306 搭建的 Gemfire 集群是相似的。

有關 12306 架構，可以參考我之前寫的另一篇文章《漫談 12306 架構》 https://www.cnblogs.com/KSongKing/p/9550000.html

Gemfire 也是一個內存數據庫，不過不是關系數據庫，是一個 Key Value 數據庫，支持組建集群，也就是水平擴展，這樣可以增加處理器和內存數量來支持大並發。

而 OceanBase 和 Gemfire 集群兩者在實際中對並發的處理規模也是可以相提並論的。

但是，光憑內存計算等技術實現的卓越性能是否能夠應對 “天量”交易？

不能。

我們可以作一個設定，每秒 1000萬次以上的交易量稱為 “天量" 。

下面我們以每秒 1000萬次作為目標來分析如何達到每秒 1000萬次這樣的並發量。

一個 CPU 核，能夠處理每秒 1000次的事務就已經不錯了。即使采用了內存計算，能夠達到每秒 1000次，已經不錯了。

這是一個什么概念呢？就是 1 毫秒（ms）處理一個事務。也就是 1 秒能處理 1000 個事務。

所以，對於每秒 1000萬次的事務，需要 1000萬 / 1000 = 1 萬個 CPU 核，

如果以每台服務器 100 核來看，需要 100 台服務器，

如果以每台服務器 50 核來看，需要 200 台服務器。

大概是這么一個體量。

其次，需要在業務層面進行很細的分庫分表。

因為事務會鎖定表，這會導致即使有 1 萬個 CPU 核，但是對於 A 表的操作同時也只能有一個核（線程）能進行。

這就又回到了和單核（單線程）等價的情形。

大家可能會提出，能不能用行鎖定和樂觀鎖定來代替表鎖定？

這 2 種方式我在上面引用的我寫的另外一篇文章《論大並發下的樂觀鎖定 Redis鎖定和新時代事務》里都分析過。

但， ……

而且除了鎖，事務還有另外一個作用，就是數據完整性，即交易失敗時，數據可以恢復原樣。

所以，總的來說，傳統事務還是必需的。

所以，需要在業務層面進行很細的分庫分表。

既然有 1 萬個核，最好能分成 1 萬個表，這樣每個核一個表，大家互相不會干擾，可以跑的很開心。

1 萬個核一起歡快的奔跑着，啦啦啦 ~~~

至於分幾個庫，那大家看着辦好了。

而實際上，對於淘寶天貓的業務來講，還真可以分 1 萬個表。

對於淘寶天貓這樣的零售業來講，交易大部分是購買付賬，在交易里要做的事是判斷庫存剩余量，修改商品狀態，修改庫存。

這樣就可以按照商戶商品類別來分庫分表。

那么，既然這樣的話，我們提出一個問題，

能不能不用 OceanBase ，用其它常用的數據庫，比如 Oracle, SqlServer, MySql, PostgreSql 等來實現和阿里類似的架構和效果？

能。

我們以 Sql Server 為例， Sql Server 發展到現在，在利用多核和內存上做的很好。

我們以 SqlServer 2017 為例，按照上面計算出來的體量，部署 200 台服務器，每台服務器 CPU 50 核，內存 100 G（相當於每個核 2 G 內存），再加上固態硬盤，

可以達到接近或者類似阿里淘寶天貓架構的效果。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 天貓雙十一狂搶優惠券？機智的程序猿這么玩 Power BI(天貓雙十一美妝銷售數據分析) 淘寶奇門（天貓奇門/阿里奇門）詳解分享一個淘寶/天貓/京東/阿里圖片抓取工具淘寶天貓商品抓取支付寶淘寶天貓喵口令原理分析天貓和淘寶有什么區別 2021雙十一快遞高峰期幾天?雙十一快遞多少天能到用便簽提醒 android scheme打開天貓，淘寶 Mac 無法打開淘寶,天貓,京東等

淺析 阿里 OceanBase 雙十一 淘寶天貓 天量交易 承載能力 原理

免責聲明！

淺析阿里 OceanBase 雙十一淘寶天貓天量交易承載能力原理