本文來自:http://blog.itpub.net/22664653/viewspace-1714269/
一 前言
MySQL 的主從復制作為一項高可用特性,用於將主庫的數據同步到從庫,在維護主從復制數據庫集群的時候,作為專職的MySQL DBA,筆者相信大多數人都會遇到“Got fatal error 1236 from master when reading data from binary log” 這類的報錯/報警。本文整理了常見的幾種 error 1236 報錯,並給出相應的解決方法,有所不足之處,當然也希望各位讀者朋友指正。
二 常見的error 1236 報錯
2.1 logevent超過max_allowed_packet 大小
- Got fatal error 1236 from master when reading data from binary log: 'log event entry exceeded max_allowed_packet; Increase max_allowed_packet on master; the start event position from 'mysql-bin.006730' at 290066246, the last event was read from '/u01/my3309/log/mysql-bin.006730
【原因】
此類報錯和max_allowed_packet相關。首先max_allowed_packet控制着主從復制過程中,一個語句產生的二進制binlog event大小,它的值必須是1024的倍數 。出現此類錯誤的常見原因是
1 該參數在主備庫的配置大小不一樣,主庫的配置值大於從庫的配置值。 從主庫傳遞到備庫的binlog event大小超過了主庫或者備庫的max_allowed_packet大小。
2 主庫有大量數據寫入時,比如在主庫上執行 laod data,insert into .... select 語句,產生大事務。
當主庫向從庫傳遞一個比從庫的max_allowed_packet 大的packet ,從庫接收該packet失敗,並報 “log event entry exceeded max_allowed_packet“。
【如何解決】
需要確保主備配置一樣,然后嘗試調大該參數的值。
- set global max_allowed_packet =1*1024*1024*1024;
- stop slave;
- start slave
另外,5.6 版本中的 slave_max_allowed_packet_size 參數控制slave 可以接收的最大的packet 大小,該值通常大於而且可以覆蓋 max_allowed_packet 的配置, 進而減少由於上面的問題導致主從復制中斷。
2.2 slave 在主庫找不到binlog文件
- Got fatal error 1236 from master when reading data from binary log:
【原因】
該錯誤發生在從庫的io進程從主庫拉取日志時,發現主庫的mysql_bin.index文件中第一個文件不存在。出現此類報錯可能是由於你的slave 由於某種原因停止了好長一段是時間,當你重啟slave 復制的時候,在主庫上找不到相應的binlog ,會報此類錯誤。或者是由於某些設置主庫上的binlog被刪除了,導致從庫獲取不到對應的binglog file。
【如何解決】
1 為了避免數據丟失,需要重新搭建slave 。
2 注意主庫binlog的清理策略,選擇基於時間過期的刪除方式還是基於空間利用率的刪除方式。
不要使用rm -fr 命令刪除binlog file,這樣不會同步修改mysql_bin.index 記錄的binlog 條目。在刪除binlog的時候確保主庫保留了從庫 show slave status 的Relay_Master_Log_File對應的binlog file。
2.3 主庫空間問題,日志被截斷
- Got fatal error 1236 from master when reading data from binary log: 'binlog truncated in the middle of event; consider out of disk space on master; the start event position from 'mysql-bin.006730' at 290066434, the last event was read from '/u01/my3309/log/mysql-bin.006730
【原因】
該錯誤和主庫的空間問題和sync_binlog配置有關,當主庫 sync_binlog=N不等於1且磁盤空間滿時,MySQL每寫N次binary log,系統才會同步到磁盤,但是由於存儲日志的磁盤空間滿而導致MySQL 沒有將日志完全寫入磁盤,binlog event被截斷。slave 讀取該binlog file時就會報錯"binlog truncated in the middle of event;"
當sync_binlog 的默認值是0,像操作系統刷其他文件的機制一樣,MySQL不會同步到磁盤中去而是依賴操作系統來刷新binary log。
當sync_binlog =N (N>0) ,MySQL 在每寫 N次 二進制日志binary log時,會使用fdatasync()函數將它的寫二進制日志binary log同步到磁盤中去。
【如何解決】
在從庫重新指向到主庫下一個可用的binlog file 並且從binlog file初始化的位置開始
- stop slave;
- change master to master_log_file='mysql-bin.006731', master_log_pos=4;
- start slave;
2.4 主庫異常斷電,從庫讀取錯誤的position
- 120611 20:39:38 [ERROR] Error reading packet from server: Client requested master to start replication from impossible position ( server_errno=1236)
- 120611 20:39:38 [ERROR] Slave I/O: Got fatal error 1236 from master when reading data from binary log: 'Client requested master to start replication from impossible position', Error_code: 1236
- 120611 20:39:38 [Note] Slave I/O thread exiting, read up to log 'mysql-bin.000143', position 664526789
【原因】
該問題也是和sync_binlog=N不等於1有關,多出現在主機異常crash ,比如磁盤損壞,raid 卡損壞,或者主機異常掉電導致binlog 未及時同步到磁盤。從庫讀取了主庫binlog file中的不存在的binlog position ,一般比binlogfile 的end position 的值還要大。
【如何解決】
1 在從庫重新指向到主庫下一個可用的binlog file 並且從binlog file初始化的位置開始
- stop slave;
- change master to master_log_file='mysql-bin.000144', master_log_pos=4;
- start slave;
2 主備庫設置 sync_binlog=1,但是設置為1的時候,會帶來性能下降。
三 相關閱讀
MySQL Replication: ‘Got fatal error 1236’ causes and cures
1 max_allowed_packet 官方介紹
2 Percona MySQL的特性 max_binlog_files
3 sync_binlog innodb_flush_log_at_trx_commit 淺析