MySQL Got fatal error 1236原因和解決方法【轉】


本文來自:http://blog.itpub.net/22664653/viewspace-1714269/

一 前言
  MySQL 的主從復制作為一項高可用特性,用於將主庫的數據同步到從庫,在維護主從復制數據庫集群的時候,作為專職的MySQL DBA,筆者相信大多數人都會遇到“Got fatal error 1236 from master when reading data from binary log” 這類的報錯/報警。本文整理了常見的幾種 error 1236 報錯,並給出相應的解決方法,有所不足之處,當然也希望各位讀者朋友指正。

二 常見的error 1236 報錯
2.1 logevent超過max_allowed_packet 大小

  1. Got fatal error 1236 from master when reading data from binary log: 'log event entry exceeded max_allowed_packet; Increase max_allowed_packet on master; the start event position from 'mysql-bin.006730' at 290066246, the last event was read from '/u01/my3309/log/mysql-bin.006730

原因
   此類報錯和max_allowed_packet相關。首先max_allowed_packet控制着主從復制過程中,一個語句產生的二進制binlog event大小,它的值必須是1024的倍數 。出現此類錯誤的常見原因是
 1 該參數在主備庫的配置大小不一樣,主庫的配置值大於從庫的配置值。 從主庫傳遞到備庫的binlog event大小超過了主庫或者備庫的max_allowed_packet大小。
 2 主庫有大量數據寫入時,比如在主庫上執行 laod data,insert into .... select 語句,產生大事務。
當主庫向從庫傳遞一個比從庫的max_allowed_packet 大的packet ,從庫接收該packet失敗,並報 “log event entry exceeded max_allowed_packet“。
如何解決
 需要確保主備配置一樣,然后嘗試調大該參數的值。

  1. set global max_allowed_packet =1*1024*1024*1024;
  2. stop slave;
  3. start slave

另外,5.6 版本中的 slave_max_allowed_packet_size 參數控制slave 可以接收的最大的packet 大小,該值通常大於而且可以覆蓋 max_allowed_packet 的配置, 進而減少由於上面的問題導致主從復制中斷。

2.2 slave 在主庫找不到binlog文件
 

  1. Got fatal error 1236 from master when reading data from binary log:

原因
 該錯誤發生在從庫的io進程從主庫拉取日志時,發現主庫的mysql_bin.index文件中第一個文件不存在。出現此類報錯可能是由於你的slave 由於某種原因停止了好長一段是時間,當你重啟slave 復制的時候,在主庫上找不到相應的binlog ,會報此類錯誤。或者是由於某些設置主庫上的binlog被刪除了,導致從庫獲取不到對應的binglog file。
如何解決
 1 為了避免數據丟失,需要重新搭建slave 。
 2 注意主庫binlog的清理策略,選擇基於時間過期的刪除方式還是基於空間利用率的刪除方式。
  不要使用rm -fr 命令刪除binlog file,這樣不會同步修改mysql_bin.index 記錄的binlog 條目。在刪除binlog的時候確保主庫保留了從庫 show slave status 的Relay_Master_Log_File對應的binlog file。

2.3 主庫空間問題,
日志被截斷

  1. Got fatal error 1236 from master when reading data from binary log: 'binlog truncated in the middle of event; consider out of disk space on master; the start event position from 'mysql-bin.006730' at 290066434, the last event was read from '/u01/my3309/log/mysql-bin.006730

原因
 該錯誤和主庫的空間問題和sync_binlog配置有關,當主庫 sync_binlog=N不等於1且磁盤空間滿時,MySQL每寫N次binary log,系統才會同步到磁盤,但是由於存儲日志的磁盤空間滿而導致MySQL 沒有將日志完全寫入磁盤,binlog event被截斷。slave 讀取該binlog file時就會報錯"binlog truncated in the middle of event;"
 當sync_binlog 的默認值是0,像操作系統刷其他文件的機制一樣,MySQL不會同步到磁盤中去而是依賴操作系統來刷新binary log。
 當sync_binlog =N (N>0) ,MySQL 在每寫 N次 二進制日志binary log時,會使用fdatasync()函數將它的寫二進制日志binary log同步到磁盤中去。
如何解決
 在從庫重新指向到主庫下一個可用的binlog file 並且從binlog file初始化的位置開始

  1. stop slave;
  2. change master to master_log_file='mysql-bin.006731', master_log_pos=4;
  3. start slave;

2.4 主庫異常斷電,從庫讀取錯誤的position

  1. 120611 20:39:38 [ERROR] Error reading packet from server: Client requested master to start replication from impossible position ( server_errno=1236) 
  2. 120611 20:39:38 [ERROR] Slave I/O: Got fatal error 1236 from master when reading data from binary log: 'Client requested master to start replication from impossible position', Error_code: 1236
  3. 120611 20:39:38 [Note] Slave I/O thread exiting, read up to log 'mysql-bin.000143', position 664526789

【原因】
 該問題也是和sync_binlog=N不等於1有關,多出現在主機異常crash ,比如磁盤損壞,raid 卡損壞,或者主機異常掉電導致binlog 未及時同步到磁盤。從庫讀取了主庫binlog file中的不存在的binlog position ,一般比binlogfile 的end position 的值還要大。
如何解決
1 在從庫重新指向到主庫下一個可用的binlog file 並且從binlog file初始化的位置開始

  1. stop slave;
  2. change master to master_log_file='mysql-bin.000144', master_log_pos=4;
  3. start slave;

2 主備庫設置 sync_binlog=1,但是設置為1的時候,會帶來性能下降。 

三 相關閱讀

 MySQL Replication: ‘Got fatal error 1236’ causes and cures

max_allowed_packet 官方介紹
Percona MySQL的特性 max_binlog_files   
sync_binlog innodb_flush_log_at_trx_commit 淺析  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM