一、數據庫架構原則

高可用
高性能
可擴展
一致性

二、常見的架構方案

方案一：主備架構，只有主庫提供讀寫服務，備庫冗余作故障轉移用

jdbc:mysql://vip:3306/xxdb

高可用分析：高可用，主庫掛了，keepalive（只是一種工具）會自動切換到備庫。這個過程對業務層是透明的，無需修改代碼或配置。
高性能分析：讀寫都操作主庫，很容易產生瓶頸。大部分互聯網應用讀多寫少，讀會先成為瓶頸，進而影響寫性能。另外，備庫只是單純的備份，資源利用率50%，這點方案二可解決。
一致性分析：讀寫都操作主庫，不存在數據一致性問題。
擴展性分析：無法通過加從庫來擴展讀性能。
可落地分析：兩點影響落地使用。第一，性能一般，這點可以通過建立高效的索引和引入緩存來增加讀性能，進而提高性能。這也是通用的方案。第二，擴展性差，這點可以通過分庫分表來擴展。

方案二：雙主架構，兩個主庫同時提供服務，負載均衡

jdbc:mysql://vip:3306/xxdb

高可用分析：高可用，一個主庫掛了，不影響另一台主庫提供服務。這個過程對業務層是透明的，無需修改代碼或配置。
高性能分析：讀寫性能相比於方案一都得到提升，提升一倍。
一致性分析：存在數據一致性問題。請看，一致性解決方案。
擴展性分析：當然可以擴展成三主循環，但不建議（會多一層數據同步，這樣同步的時間會更長）。如果非得在數據庫架構層面擴展的話，擴展為方案四。
可落地分析：兩點影響落地使用。第一，數據一致性問題，一致性解決方案可解決問題。第二，主鍵沖突問題，ID統一地由分布式ID生成服務來生成可解決問題。

方案三：主從架構，一主多從，讀寫分離

jdbc:mysql://master-ip:3306/xxdb

jdbc:mysql://slave1-ip:3306/xxdb

jdbc:mysql://slave2-ip:3306/xxdb

高可用分析：主庫單點，從庫高可用。一旦主庫掛了，寫服務也就無法提供。
高性能分析：大部分互聯網應用讀多寫少，讀會先成為瓶頸，進而影響整體性能。讀的性能提高了，整體性能也提高了。另外，主庫可以不用索引，線上從庫和線下從庫也可以建立不同的索引（線上從庫如果有多個還是要建立相同的索引，不然得不償失；線下從庫是平時開發人員排查線上問題時查的庫，可以建更多的索引）。
一致性分析：存在數據一致性問題。請看，一致性解決方案。
擴展性分析：可以通過加從庫來擴展讀性能，進而提高整體性能。（帶來的問題是，從庫越多需要從主庫拉取binlog日志的端就越多，進而影響主庫的性能，並且數據同步完成的時間也會更長。建議不要分多層，且一台主庫一般掛3-5台從庫吧。一般配置的mysql，並發最好控制在2000/s，掛5台的話，整體基本能支撐1w+/s的並發，再加上緩存和二八定律，基本能支撐小10w/s的並發，很高了。如果還不能滿足需求，那還是選擇去分庫吧。）
可落地分析：兩點影響落地使用。第一，數據一致性問題，一致性解決方案可解決問題。第二，主庫單點問題，暫時沒想到很好的解決方案（這點評論里給了一種方案，可參考）。

注：思考一個問題，一台從庫掛了會怎樣？讀寫分離之讀的負載均衡策略怎么容錯？

方案四：雙主+主從架構，看似完美的方案

jdbc:mysql://vip:3306/xxdb

jdbc:mysql://slave1-ip:3306/xxdb

jdbc:mysql://slave2-ip:3306/xxdb

高可用分析：高可用。
高性能分析：高性能。
一致性分析：存在數據一致性問題。請看，一致性解決方案。
擴展性分析：可以通過加從庫來擴展讀性能，進而提高整體性能。（帶來的問題同方案二）
可落地分析：同方案二，但數據同步又多了一層，數據延遲更嚴重。

三、一致性解決方案

第一類：主庫和從庫一致性解決方案

注：圖中圈出的是數據同步的地方，數據同步（MySQL主從復制，簡單來說就是從庫從主庫拉取binlog日志，再執行一遍，想深入了解可以去查閱“MySQL主從復制原理”相關資料）是需要時間的，這個同步時間內主庫和從庫的數據會存在不一致的情況。如果同步過程中有讀請求，那么讀到的就是從庫中的老數據。如下圖。

既然知道了數據不一致性產生的原因，有下面幾個解決方案供參考：

直接忽略，如果業務允許延時存在，那么就不去管它。
強制讀主，采用主備架構方案，或者代碼指定讀主庫（一般不建議，這樣就失去了讀寫分離的意義），讀寫都走主庫。
選擇讀主，寫操作時根據庫+表+業務特征生成一個key放到Cache里並設置超時時間（大於等於主從數據同步時間）。讀請求時，同樣的方式生成key先去查Cache，再判斷是否命中。若命中，則讀主庫，否則讀從庫。代價是多了一次緩存讀寫，基本可以忽略。
數據庫中間件，引入開源（mycat等）或自研的數據庫中間層。個人理解，思路同選擇讀主。數據庫中間件的成本比較高，並且還多引入了一層。

第二類：DB和緩存一致性解決方案

先來看一下常用的緩存使用方式：

第一步：淘汰緩存；

第二步：寫入數據庫；

第三步：讀取緩存？返回：讀取數據庫；

第四步：讀取數據庫后寫入緩存。

一般來說，並發量不是特別大的話，上面的方式就可以。但是如果是高並發量的情況下，當寫入時，你淘汰了緩存，但是還沒寫入數據庫時或者主從延時，就有一個讀請求完成了，此時緩存中就會緩存舊的數據。此時可以，寫庫完成時，等一會（根據業務場景評估）再刪除一次緩存，這樣緩存舊數據的概率又低了，不過這樣一來數據庫的壓力就會有相應的增加，並且響應時間會增加。其實，要想保證數據庫和緩存嚴格的一致性很難，甚至要付出很高的代價。網上還個方案，就是用本地內存隊列來控制讀請求和寫請求串行化，利弊都有，感興趣可深入研究：高並發場景下，如何保證緩存和數據庫雙寫的一致性。另外，思考一下是不是能用基於臨時順序節點的Zookeeper分布式鎖（用兩個鎖，一個讀鎖，一個寫鎖，當排在寫鎖后面的第一個讀鎖被通知時，讀操作完成后，批量刪除后面連續的讀鎖，注意不要引發羊群效應 -> 主備架構時）？

注：設置緩存時，一定要加上失效時間！

四、個人的一些見解

1、架構演變

架構演變一：方案一 -> 方案一+分庫分表；
架構演變二：方案一 -> 方案三 -> 方案三+分庫分表
架構演變三：方案一 -> 方案二 -> 方案二+分庫分表

注：方案四一般不用。

2、個人見解

加緩存和索引是通用的提升數據庫性能的方式；
分庫分表帶來的好處是巨大的，但同樣也會帶來一些問題，詳見MySQL數據庫之互聯網常用分庫分表方案。
不管是主備+分庫分表還是主從+讀寫分離+分庫分表，都要考慮具體的業務場景。一般大部分的數據庫架構還是采用方案一和方案一+分庫分表，典型的讀多寫少的場景用方案三+讀寫分離+分庫分表。另外，阿里雲提供的數據庫雲服務也都是主備方案，要想主從+讀寫分離需要二次架構。
記住一句話：不考慮業務場景的架構都是耍流氓。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MySQL數據庫之互聯網常用分庫分表方案互聯網行業中最常用的數據庫——MySQL數據庫介紹互聯網數據庫架構設計思路互聯網數據庫架構設計思路數據庫之互聯網常用分庫分表方案互聯網創業的准備——數據庫：硬盤iops、mysql 互聯網級監控系統必備-時序數據庫之Influxdb技術互聯網級監控系統必備-時序數據庫之Influxdb集群及踩過的坑在互聯網中關系型數據庫是否不再那么重要實戰互聯網公司數據存儲解決方案