MySql Replication基本原理

本文轉載自查看原文 2018-08-17 10:16 2434 MariaDB

　Replication的思想是將數據在集群的多個節點同步、備份，以提高集群數據的可用性（HA）；Mysql使用Replication架構來實現上述目的，同時可以提升了集群整體的並發能力。5.6版本作為一個里程碑，對replication做了不少的優化調整，提高了集群數據的一致性、同步的性能以及數據自動恢復（recovery）的能力。（本文內容基於MySQL 5.6+，不過在5.7+版本仍有部分調整）

　　Replication架構通常由一個master和一個或者多個slaves構成，master接收應用的writes操作（事務中的read、write操作均有master處理），slaves接收read操作。在master上發生的數據變更，都將會復制給slaves，從直觀而言，replication架構解決了：1）數據多點備份，提高數據可用性。 2）讀寫分流，提高集群的並發能力。（並非是負載均衡）3）讓一些非實時的數據操作，轉移到slaves上進行。

　　下文中提到的“變更操作”為“insert”、“update”、“delete”等，與MySQL中的“update events”、“事務操作”、“writes”同義。

Replication具有如下優點：

　　1）擴展：將負載分布在多個slaves上以提高性能，所有的writes以及事務中的read操作都將有master處理，其他reads將轉發給slaves；對於“讀寫比”較高的應用，replication可以通過增加slaves節點來提高並發能力；因為write只能在master上提交，因此架構擴展對提升write並發能力並不明顯，對於writes密集性應用我們應該考慮其他架構。
　　2）數據安全：slave可以中斷自己的replication進程，這不會打斷master上的數據請求，所以可以在slave上運行backup服務，定期全量backup是保護數據的手段之一。（如果在master上執行backup，需要讓master處於readonly狀態，這也意味這所有的write請求需要阻塞）。
　　3）分析：數據在master上創建，那么數據分析可以在slave上進行，這將不會影響master的性能。利用mysql做數據分析（或者數據分析平台的源數據），通常都是將某個slave作為數據輸入端。
　　4）遠距數據分布：如果master的物理位置較遠，你可以在臨近需求的地方部署slaves，以便就近使用數據，而不需要總是訪問遠端的master，這在數據分析、數據備份與容災等方面有很大幫助。

　　MySQL架構的演變分多個階段，目前基於replication架構模式的更高級架構設計有“MySQL Fabric”和“MySQL Cluster”。本文主要講解基本的replication模式，如下為replication與Fabirc、Cluster的區別，以便我們做技術選型：

　　1、MySQL Fabirc
　　
　　Farbic由replication基礎特性和一些擴展框架構建而成，用於管理MySQL Servers Farms，與基本的replicaiton相比，它實現了2個核心的特性：HA和sharding。Fabric集群中任何時候只有一個Primary（即master），其他的實例為Secondaries（即slaves）；通過使用replication，將數據在多個節點上備份，HA總是保持集群的數據可用性。如下特性是replication所不具備的：

　　1）故障檢測和角色遷移（Failover）：Fabric進程用於監控集群中的所有節點，如果發現primary失效，稍后他將從Secondaries中選擇一個“數據最新”的節點，並提升為primary；此后其他的secondaries將從新的priamry上同步數據變更操作。Connectors（比如Connector/J客戶端）發現primary故障時也會通知Fabirc，那么Fabric將通知信息作為決策的一部分來判定priamry的狀態。這個特性簡稱為“自動Failover”，是replication架構中必備的手段之一。

　　2）數據庫請求路由（Router）：當Fabric提升一個新的primary后，它將會更新state store（存儲replication的節點狀態等），此后Connectors將會獲取新的state數據並在客戶端本地cache。因此，application不需要時刻關注（aware）集群中servers拓撲結構的變化，只需要根據state cache中的server狀態，將writes發送給相應的primary即可。這種特性有Connectors客戶端與與Fabric共同實現，在普通的replication架構中，客戶端自動角色路由是無法完成的。如果cache中拓撲不是最新的，application的操作異常將會反饋給Fabirc，參考1）。

　　Fabirc支持sharding，對較大規模的數據可以非常便捷的在集群中分布而無需太多人工干預，我們可以簡單的認為Fabric是replication模式的完善，支持自動Failover。對於互聯網應用，Fabric架構簡單而且有效，是首選方案。

　　2、MySQL Cluster
　　
　　相對於Fabirc，MySQL Cluster支持更大規模的數據，其架構模式和原理也更加復雜。Cluster是一個易於擴展、實時的、ACID兼容的事務性數據庫，支持“全分布式”、“多Master”架構，無單點問題；MySQL Cluster可以部署在普通的商業機器上，多節點水平擴展、Server間數據自動sharding和負載均衡，用於服務read、write都密集的應用，可以使用SQL和NOSQL接口訪問數據。Cluster的架構思想與Hadoop非常類似，它設計的前提是“認為每個Node都是易於出錯的”、集群規模巨大、多租戶，所以它提供了數據備份機制、自動遷移、自動Failover等特性，來保證可用性、健壯性。

　　MySQL Cluster使用了一個插件式的存儲引擎，與MySQL 存儲引擎（InnoDB、MySAM）架構有很大不同，我們在此不做詳細介紹，只需要知道它的核心特性為：數據集並不是存儲某個特定的MySQL實例上，而是被分布在多個Data Nodes中，即一個table的數據可能被分散在多個物理節點上，任何數據都會在多個Data Nodes上冗余備份。任何一個數據變更操作，都將在一組Data Nodes上同步（嚴格意義上的同步，synchronous，二階段提交？）以保證數據的一致性。

　　由此可見，Replication架構簡單、易於管理；Fabric是Replicaiton模式的完善和補充，增加了自動Failover和sharding機制，以支撐更大規模的數據訪問，減少人工干預；Cluster是一個全分布式架構，是面向大規模數據存儲的解決方案。

一、基礎

　　Replication模式的主要目的是將master上的數據變更復制到一個或者多個slaves上，多個節點備份以提高數據的可用性，避免單點問題；如果只有一個mysql節點，那么當此節點的宿主機器損壞，將可能導致數據永久性丟失。Replication與Connector配合，可以實現讀寫分流的功能，從而提升集群整體的並發能力。
　　
　　根據實際需要，我們可以指定某個（些）Databases或者tables參replication，不過replication的表現態仍然是集群中所有的實例上數據集一樣，這與Farbic、Cluster不同，在Cluster中不同的Data Nodes上數據集或許完全不同。

　　Repliction模式中，在master上發生的數據變更都將被立即寫入binlog，此后它們被slaves讀取到本地，並應用這些數據變更操作，從而實現據“replication”。slaves的數據同步只會消耗較少的master資源（每個slave或許有1%的額外開支），通常一個master組合幾個slaves（3~5個）是比較常見的，而不會有數十個slaves，否則你應該考慮Cluster架構。

二、復制模式（Replication models）

　　replication支持兩種模式：asynchronous（異步）、semi-synchronous（半同步）；“synchronous”復制只有Cluster才支持，本文不做介紹。復制模式會對數據完整性有很大影響。
　　

1、Asynchronous復制

　　這是replication的默認模式，在master上提交的updates操作執行成功且寫入binlog之后，master繼續處理其他的write請求，而不會等待slaves對此update信息的復制或者應用；此后的任何時候，slaves均可以與master建立鏈接並復制那些尚未獲取的變更日志，然后在本地應用（apply）。

　　異步模式，無法保證當master失效后所有的updates已經復制到了slaves上，只有重啟master才能繼續恢復這些數據，如果master因為宿主機器物理損壞而無法修復，那些尚未復制到slaves上的updates將永久性丟失；因此異步方式存在一定的數據丟失的風險，但它的優點就是master支持的write並發能力較強，因為master上的writes操作與slaves的復制是互為獨立的。

　　不過這種模式，slaves總有一定的延后，這種延后在事務操作密集的應用中更加明顯，不過通常這種延后時間都極其短暫的。從另一個方面來說，異步方式不要求slaves必須時刻與master建立鏈接，可能slaves離線、中斷了replication進程或者鏈接的傳輸延遲很高，這都不會影響master對writes請求的處理效率。比如對於“遠距分布”的slaves，異步復制是比較好的選擇。

　　此模式下，如果master失效，我們通常的做法是重啟master，而不是failover到其他的slave，除非master無法恢復；因為master上會有些updates尚未復制給slaves，如果此時failover則意味着那些updates將丟失。

2、Semi-synchronous

　　“半同步”並不是MySQL內置的replication模式，而且由插件實現，即在使用此特性之前，需要在master和slaves上安裝插件，且通過配置文件開啟“半同步”。當slave與master建立連接時會表明其是否開啟了“半同步”特性；此模式正常運作，需要master和至少一個slaves同時開啟，否則仍將采用“異步”復制。

　　在master上執行事務提交的線程，在事務提交后將會阻塞，直到至少一個“半同步”的slave返回確認消息（ACK）或者所有的半同步slave都等待超時；slave將接收到事務的信息寫入到本地的relay log文件且flush到磁盤后，才會向master返回確認消息，需要注意slave並不需要此時就執行事務提交，此過程可以稍后進行。當所有的半同步slaves均在指定的時間內沒有返回確認消息，即timeout，那么此后master將轉換成異步復制模式，直到至少一個半同步slave完全跟進才會轉換為半同步模式。在master阻塞結束后才會返回給客戶端執行的狀態，此期間不會處理其他的事務提交，當write請求返回時即表明此操作在master上提交成功，且在至少一個半同步slaves也復制成功或者超時，阻塞超時並不會導致事務的rollback。（對於事務性的表，比如innodb，默認是事務自動提交，當然可以關閉“autocommit”而手動提交事務，它們在replication復制機制中並沒有區別）

　　半同步模式需要在master和slaves上同時開啟，如果僅在master上開啟，或者master開啟而slaves關閉，最終仍然不能使用半同步復制，而是采用異步復制。

　　與異步復制相比，半同步提高了數據一致性，降低了數據丟失的風險。但是它也引入了一個問題，就是master阻塞等待slaves的確認信息，在一定程度上降低了master的writes並發能力，特別是當slaves與master之間網絡延遲較大時；因此我們斷定，半同步slaves應該部署在與master臨近的網絡中，為了提高數據一致性，我們有必要將半同步作為replication的首選模式。
　　
　　在實際的部署環境中，並不要求所有的slaves都開啟半同步，我們可以將與master臨近的slaves開啟半同步，將那些“遠距分布”的slaves使用異步。

三、日志格式（Replication Formats）

　　Replication之所以能夠工作，主要還是歸結於binlog（binary log），所以在replication模式下必須開啟binlog功能；slave從masters上增量獲取binlog信息，並在本地應用日志中的變更操作（即“重放”）。變更操作將根據選定的格式類型寫入binlog文件，目前支持三種format：
　　
　　1、statement-based replication（SBR）：master將SQL statements語句寫入binlog，slave也將statements復制到本地執行；簡單而言，就是在master上執行的SQL變更語句，也同樣在slaves上執行。SBR模式是MySQL最早支持的類型，也是replication默認類型。如論何種情況，DDL語句一定是SBR格式。

　　2、row-based replication（RBR）： master將每行數據的變更信息寫入binlog，每條binlog信息表示一行（row）數據的變更內容，對於slaves而言將會復制binlog信息，然后單條或者批量執行變更操作。

　　3、mix-format replication：混合模式，在這種模式下，master將根據根據存儲引擎、變更操作類型等，從SBR、RBR中來選擇更合適的日志格式，默認為SBR；具體選擇那種格式，這取決於變更操作發生的存儲引擎、statement的類型以及特征，優先選擇“數據一致性”最好的方式（RBR），然后才兼顧性能，比如statement中含有“不確定性”方法或者批量變更，那么將選擇RBR方式，其他的將選擇SBR以減少binlog的大小。我們建議使用mix方式。

SBR和RBR都有各自的優缺點，對於大部分用而言，mix方式在兼顧數據完整性和性能方面是最佳的選擇。

　　SBR的優點：因為binlog中只寫入了變更操作的statements，所以日志量將會很小；當使用SQL語句批量更新、刪除數據時，只需要在binlog中記錄statement即可，可以大大減少log文件對磁盤的使用。當然這也意味着slave復制信息量也更少，以及通過binlog恢復數據更加快速。
　　
　　SBR的缺點：有些變更操作使用SBR方式會帶來數據不一致的問題，一些結果具有不確定性的操作使用SBR將會引入數據不一致的問題。
　　
　　1）statement中使用了UDF，UDF的計算結果可能依賴於SQL執行的時機和系統變量，這可能在slave上執行的結果與master不同，此外如果使用了trigger，也會帶來同樣的問題。（User Defination Fuction）；
　　
　　2）對於批量delete或者update操作中，使用了limit限定詞，但是沒有使用“order by”，這樣的SQL語句執行的結果是不確定的，無論是在master還是slaves，即使在同一個節點上不同時機執行結果都有可能不一樣，replication同理，這歸因於MySQL數據存儲的機制。（默認排序將采用底層數據文件的實際存儲順序，innodb為primary key順序）；
　　
　　3）statement中使用了如下函數的（舉例）：UUID()，SYSDATE()，RAND()等，不過NOW()函數可以正確的被replication（但在UDF或者觸發器中則不行）；這些函數的特點就是它們的值依賴於本地系統，RAND()本身就是隨機所以值是不確定的。如果statement中使用了上述函數，那么將會在日志中輸出warning信息；
　　
　　4）對於“INSERT … SELECT”語句，SBR將比RBR需要更多的行鎖。如果UPDATE語句中沒有使用索引而導致全表掃描的話，SBR將比RBR需要更多的行鎖。（主要是為了保障數據一致性，需要同時鎖定受影響的所有的行，而RBR則不必要）；
　　
　　5）對於InnoDB，使用“AUTO_INCREMENT”的insert語句，將會阻塞其他“非沖突”的INSERT。（因為AUTO_INCREMENT，為了避免並發導致的數據一致性問題，只能串行，但RBR則不需要）；
　　
　　6）對於復雜的SQL語句，在slaves上仍然需要評估（解析）然后才能執行，而對於RBR，SQL語句只需要直接更新相應的行數據即可；
　　
　　7）在slave上評估、執行SQL時可能會發生錯誤，這種錯誤會隨着時間的推移而不斷累加，數據一致性的問題或許會不斷增加。

RBR的優點：

　　1）所有的變更操作，都可以被正確的replication，這事最安全的方式；
　　
　　2）對於“INSERT … SELECT”、包含“AUTO_INCREMENT”的inserts、沒有使用索引的UPDATE/DELETE，相對於SBR將需要更少的行鎖。（意味着並發能力更強）；
　　
RBR的缺點：

　　1）最大的缺點，就是RBR需要更多的日志量。任何數據變更操作都將被寫入log，受影響的每行都要寫入日志，日志包含此行所有列的值（即使沒有值變更的列）；因此RBR的日志條數和尺寸都將會遠大於SBR，特別是在批量的UPDATE/DELETE時，可能會產生巨大的log量，反而對性能帶來影響，盡管這確實保障了數據一致性，確導致replication的效率較低；
　　
　　2）對於MyISAN存儲引擎，INSERT語句將會阻塞更長的時間，因為在RBR模式下，MyISAM表不支持並發插入；
　　
　　3）盡管是RBR模式，但是如果slave在更新非事務性表時，server被關閉，將會導致數據不一致性問題；所以在后續的版本中，我們希望master、slaves所有的表均使用InnoDB這樣的事務性存儲引擎，事務的有序性可以保證slave在crash之后啟動，數據恢復時仍能夠保證數據一致性。

　　由此可見，SBR和RBR各有優缺點，這是個需要權衡的事情，本人認為數據一致性是數據庫的首要考慮的因素，replication性能次之，因此在新的版本中，我們建議使用RBR方式或者mixed，通常mixed是官方推薦的。

四、GTID

　　GTID全名“Global Transaction Identifiers”，全局事務性ID，每個事務都用一個ID標識，用於跟蹤master和slavers上事務提交的“進度”；這也意味着在Failover時，slaves可以不需要向新的master傳遞自己已經執行的log的positions（binglog的offset），只需要告知新的master自己已經執行的最后一條事務的ID即可，這極大的簡化了failover、日志replication的復雜度。因為GTID完全基於事務，可以非常簡單的判定master與slaves是否一致，只要slaves與master上的事務提交均按照相同的順序提交，數據一致性是可以得到保證的，為了更加安全，我們建議使用RBR模式 + GTID。

　　每個GTID是全局唯一的，由master在創建事務時生成並與事務過程一並寫入binlog，slaves只對GTID讀取而不修改。GTID由“source_id:trasaction_id”組合而成（中間有“:”分割），其中source_id為源server的UUID（創建事務的master的UUID），transaction_id就是事務ID，是一個序列數字表示事務的順序（long型），每個事務都有不同的transaction_id；這種組合決定GTID的全局一致性，同時我們也可以根據GTID來判定事務在哪個server上創建的。一個GTID的事務執行后，在此后遇到相同GTID的事務將會被忽略，在master上提交的事務，可以在slaves上多次重復執行（有序執行），這對數據恢復和保證數據一致性非常有幫助。

　　在沒有GTID時，slave需要告知master，其已經復制的binlog文件的offset；當使用GTID時，那么GTID就想binlog的主鍵索引一樣，slave只需要交付GTID即可繼續進行replication，在使用“CHANGE MASTER TO”命令做failover時也不要指定“MASTER_LOG_FILE”/“MASTER_LOG_POS”選項，而是直接在命令中使用“MASTER_AUTO_POSITION”選項即可，這對運維操作非常便捷。（稍后參看運維部分）
　　
　　1）事務在master上執行並提交，並將此事務操作寫入binlog；
　　2）master將binlog增量發送給slaves，slaves將其內容保存在relay log中（同binlog，主要用於replication）；
　　3）slaves從relay log中讀取尚未執行的GTID，並將其值設為“gtid_next”；slave檢測並確保此GTID沒有被執行過，同時也確保沒有其他的線程也在讀取和操作此GTID（多線程replication時），然后再本地執行此transaction並將事務寫入本地的binlog中。

　　基於GTID的repliction，有些特性將不能很好的支持。比如，在一個事務中更新了非事務性表（MyISAM）和事務性表（InnoDB），這將破壞事務的嚴格性，因為這種“混合更新”的事務在整個過程將會在binlog中產生多個GTIDs記錄，對slaves復制將會帶來影響，因此replication中在開啟GTID時將不支持“混合更新”。

　　比如上圖架構圖，當master失效后，我們需要將其中一個slave提升為master，默認采用“異步復制”方式，因此B和C或許都沒有完全復制master上的事務，而且有可能B和C的復制進度有一些差異。我們假定，B比C更加超前，所以，B將被提升為master，此后C需要與B建立從屬關系，並從B中復制、執行那些尚未接收到的事務（由GTID判定）；當然B也需要從C中復制那些自己缺失的GTIDs，當B和C數據對齊之后，B正式提升為Master。
　　

　　在新的replication協議中，當slave與master建立鏈接后，它將會發送自己已經執行和提交的事務GTIDs的范圍（gtid_executed），master將會向slave響應slaves缺失的事務列表；如上例所示，C向B發送id1，那么B向C響應id2、id3。

五、實現原理

　　在上述介紹中我們已經基本了解了replication的原理：每個slaves與master建立鏈接，並從master“拉取”（pull）binlog副本並保存在本地（relay log），不是master主動push給slaves；slaves從本地log文件中讀取變更操作並執行。每個slave都是互相獨立的，各自的replication過程互不干擾，當然每個slave可以根據需要啟動或者暫停replication進程，而不會影響master與其他slaves的復制。

replication功能有三個線程實現，其中一個在master上，另外2個在slaves上。

　　1、Binlog dump線程：master上創建一個線程用於向slave發送binlog內容，我們可以通過“SHOW PROCESSLIST”指令查看到一個名為“Binlog Dump”的線程。dump線程會對binlog文件獲取一個讀鎖，並讀取內容發送給slave，只要一個變更操作讀取完畢后，鎖即釋放，即使內容尚未發送給slave；
　　
　　2、Slave I/O線程：當在slave上執行“START SLAVE”后，將會創建一個I/O線程，它負責與master建立鏈接並請求需要的binlog，並保存在本地的relay log中。在slave上執行“SHOW SLAVE STATUS”可以查看“Slave_IO_running”的狀態；
　　
　　master為每個slave建立一個單獨的Binlog dump線程，並同時與它們交互，每個slave持有各自的IO和SQL線程。slave使用2個單獨的線程來完成replication過程，以便它們互相影響，比如IO線程不會因為SQL線程執行較慢而拖累與master的讀取速率，當slave停止了一段時間后重啟，那么IO線程仍然可以快速的與master跟進，即使SQL線程已經落后太多；這種線程分離，最大的收益就是提高了slave復制的效率，避免slave與master差距太大，從而保證了數據安全。
　　
　　我們可以通過“SHOW PROCESSLIST”來查看上述線程的運行狀態。也可以使用“SHOW SLAVE STATUS”、“SHOW MASTER STATUS”來查看與replication有關的更多狀態信息。

在replication期間，master只需要創建與更新binlog文件即可，不過對於slave，為了復制和failover需要創建多種文件。

　　1、relay log：我們在上文中已經提到，slave IO線程從master讀取的binlog數據首先保存在本地的relay log中；此后SQL線程即可從relay log中讀取變更操作並在本地應用。嚴格意義上說，relay log的內容應該與master binlog逐字節一致的（byte-to-byte）；
　　
　　2、master info：master-info log文件保存了slave與當前master建立鏈接的一些配置信息和鏈接狀態，日志中包括：master的host名稱、login認證信息，以及slave讀取master binlog的位置信息。在5.6之前，信息保存在master.info文件中，5.6之后，可以通過“–master-info-repository=TABLE”啟動參數（或者配置文件）將信息保存在“mysql.slave_master_info”系統表中；
　　
　　3、relay log info：用於記錄relay log執行點的狀態信息，在5.6之前默認寫入relay-log.info文件，5.6之后可以通過“–relay-log-info-repository=TABLE”將信息寫入“mysql.slave_relay_log_info”系統表中。

　　為了避免crash對數據帶來的不一致問題，強烈建議將master-info、relay-log-info采用事務性表，而且建議開啟“–relay-log-recovery”。不過很遺憾的是，在5.6.5之前的版本中，slave_master_info、slave_relay_log_info表默認為MyISAM，需要手動修改為InnoDB。
　　
　　4、binlog：這個大家都很熟悉，slave上也可以開啟binlog功能，比如slave是其他slave的master時。

　　relay log內容格式與binlog一樣，也可以使用mysqlbinlog shell查看。 relay log也是有多個文件組成，和binlog非常相似，文件名稱格式類似於“host_name-relay-bin.”，此外還有一個index文件用來記錄那些relay log文件還在使用中，不能被刪除（對於master而言，binlog也是如此）。SQL線程執行完一個relay log中的變更操作后，將會自動刪除此文件，因為它不再需要。關於relay log、master info文件的內容請參看鏈接。

六、架構拓撲

　　根據replication的機制，它可以有多種架構拓撲結構，如圖所示：

　　1、Master-slave、Master-slaves：這是目前最常見的架構模式，一個master與一個或者多個slaves組合，實施簡單而且有效，是首選方式之一，不僅實現了HA，而且還能讀寫分離，進而提升集群的並發能力；
　　
　　2、Master-slave-slaves：多級復制模式，部分slave不與master跟進，而是與其他slave跟進，這在某些特殊場景下非常有效！我們知道如果master有太多的slave跟進，master將會損耗一部分性能用於replication，在上文中已經知道“半同步”的特性，那么我們可以讓3~5個slaves與master跟進，並使用“半同步”復制模式，其他的slaves作為二級，與其他slave(s)跟進，采用“異步”復制模式，這樣不僅緩解了master的壓力，而且對數據一致性並沒有負面影響；而且二級slaves可以作為“離線數據統計”、“遠距數據中心”等特殊使用場景，因為它們對數據的實時性要求不要；
　　

七、優化調整

1、多線程

　　在slave上使用多線程方式進行replication過程，可以有效提高效率。

　　 slave將多個線程根據database分割，其中一個線程為“coordinator”（協調器），從relay log中讀取變更操作，然后將不同database的操作發送給不同的worker線程，並由worker線程負責執行；可以通過“slave-parallel-workers”參數指定worker線程的個數。默認情況下slave只有一個線程，即SQL線程，此線程負責讀取relay log並執行變更操作，那么在多線程模式下，一個線程專門負責讀取relay log，並將讀取的變更操作根據database分發給不同的worker線程，那么多個database中的變更操作將可以並行的執行，這將極大的提高了replication的效率。不過這也會引入一些問題，比如事務的順序可能會與master不同，我們稍后在“【配置參數】”部分介紹。

2、binlog批量提交（Group commit）

　　 binlog數據最終要寫入磁盤，磁盤寫入的頻率越高，性能也就越低（磁盤IO效率低）；我們可以開啟binlog批量提交，而不是每個變更操作都立即寫入binlog，這樣可以有效的提高磁盤IO的性能。“sync_binlog”參數來控制磁盤寫入的頻率，默認為0，即有操作系統決定binlog文件flush的時機，“1”表示每個變更操作寫入binlog后都立即flush磁盤，其他值表示多個變更操作后才flush磁盤。

3、RBR優化

　　前文已經提到，基於RBR復制時，master將會把變更操作影響的行的所有列的值都寫入binlog，這確實提高了數據的安全性，但是卻增加了binlog的日志量，也增加了master與slave之間的網絡傳輸量。我們可以通過“binlog-row-image”參數來控制binlog輸出：
　　
　　 2）minimal：只記錄數據變更的列以及能夠標定此row的列（比如主鍵列）；此選項通常比較合適，日志量較少，而且實用。
　　
　　 3）noblob：記錄所有的列（包括未變更的列），但是不包括blob和text類型的沒有變更的列；簡而言之，就是沒有變更的大字段不會寫入binlog，其他字段無論是否變更均會寫入，具有“full”和“minimal”的優點。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MYSQL基本原理 kafka基本原理概述——patition與replication分配 mysql索引基本原理 Mysql基本原理和概念 volatile的基本原理爬蟲基本原理 Kafka基本原理 IP基本原理 GBDT的基本原理反射的基本原理