MySQL冗余數據的三種方案

本文轉載自查看原文 2017-07-03 11:35 2966

一，為什么要冗余數據

互聯網數據量很大的業務場景，往往數據庫需要進行水平切分來降低單庫數據量。

水平切分會有一個patition key，通過patition key的查詢能夠直接定位到庫，但是非patition key上的查詢可能就需要掃描多個庫了。

此時常見的架構設計方案，是使用數據冗余這種反范式設計來滿足分庫后不同維度的查詢需求。

例如：訂單業務，對用戶和商家都有訂單查詢需求：

Order(oid, info_detail);

T(buyer_id, seller_id, oid);

如果用buyer_id來分庫，seller_id的查詢就需要掃描多庫。

如果用seller_id來分庫，buyer_id的查詢就需要掃描多庫。

此時可以使用數據冗余來分別滿足buyer_id和seller_id上的查詢需求：

T1(buyer_id, seller_id, oid)

T2(seller_id, buyer_id, oid)

同一個數據，冗余兩份，一份以buyer_id來分庫，滿足買家的查詢需求；一份以seller_id來分庫，滿足賣家的查詢需求。

如何實施數據的冗余，是今天將要討論的內容。

二，服務同步雙寫

顧名思義，由服務層同步寫冗余數據，如上圖1-4流程：

優點：

缺點：

如果系統對處理時間比較敏感，引出常用的第二種方案。

三，服務異步雙寫

數據的雙寫並不再由服務來完成，服務層異步發出一個消息，通過消息總線發送給一個專門的數據復制服務來寫入冗余數據，如上圖1-6流程：

優點：

缺點：

不管是服務同步雙寫，還是服務異步雙寫，服務都需要關注“冗余數據”帶來的復雜性。如果想解除“數據冗余”對系統的耦合，引出常用的第三種方案。

四，線下異步雙寫

為了屏蔽“冗余數據”對服務帶來的復雜性，數據的雙寫不再由服務層來完成，而是由線下的一個服務或者任務來完成，如上圖1-6流程：

優點：

缺點：

五，總結

互聯網數據量大的業務場景，常常:

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MySQL刪除冗余數據 HDFS 冗余數據保存如何刪除presto上的冗余數據刪除表中的冗余數據數據冗余常見三種處理方式 Join導致冗余數據引起慢SQL 多租戶數據隔離的三種方案多租戶數據隔離的三種方案 MySQL和Redis如何保證數據一致性？三種方案對比,初版億級數據從MySQL到Hbase的三種同步方案與實踐