[MySQL] SQL_ERROR 1032解決辦法


一、緣由:

  在主主同步的測試環境,由於業務側沒有遵循同一時間只寫一個點的原則,造成A庫上刪除了一條數據,B庫上在同時更新這條數據。

由於異步和網絡延時,B的更新event先到達A端執行,造成A端找不到這條記錄,故SQL_THREAD報錯1032,主從同步停止。

 

二、錯誤說明:

  MySQL主從同步的1032錯誤,一般是指要更改的數據不存在,SQL_THREAD提取的日志無法應用故報錯,造成同步失敗

(Update、Delete、Insert一條已經delete的數據)。

  1032的錯誤本身對數據一致性沒什么影響,影響最大的是造成了同步失敗、同步停止。

  如果主主(主從)有同步失敗,要第一時間查看並着手解決。因為不同步,會造成讀取數據的不一致。應在第一時間恢復同步,

盡量減少對業務的影響。然后再具體分析不同步的原因,手動或者自動修復數據,並做pt-table-checksum數據一致性檢查。

  目前業務一般是做主主同步,主主同步由於是異步更新,存在更新沖突的問題,且很容易引起SQL ERROR 1032錯誤。這個應該在業務側解決,

保證同一時間只更新數據庫的一個點,類似單點寫入。我們的解決辦法是:寫一個底層數據庫調用庫,可能涉及到更新沖突的操作,都調用這個庫。

在配置文件里,配2個點的數據庫A、B,保證一直都更新A庫,如果A庫不可用,就去更新B庫。

  另外,如果是對數據一致性要求較高的場景,比如涉及到錢,建議用PXC(強一致性、真正同步復制)。

 

三、解決辦法:

  MySQL5.6.30版本,binlog模式為ROW。

  show slave status\G,可以看到如下報錯:

 

Slave_SQL_Running: NO
Last_SQL_Errno: 1032 Last_SQL_Error: Worker 3 failed executing transaction '' at master log mysql-bin.000003, end_log_pos 440267874;          Could not execute Delete_rows event on table db_test.tbuservcbgolog; Can't find record in 'tbuservcbgolog', Error_code: 1032;          handler error HA_ERR_KEY_NOT_FOUND; the event's master log mysql-bin.000003, end_log_pos 440267874

 

 

  從上可以看出,是SQL_THREAD線程出錯,錯誤號碼1032。是在應用delete db_test.tbuservcbgolog 表中一行數據的事件時,由於這條數據

不存在而出錯。此事件在主服務器Master binlog中的位置是 mysql-bin.000003, end_log_pos 440267874。(當然可以在從服務器Slave的Relay

log中查找,具體方法見最后) 

 

方法1:跳過錯誤Event

先跳過這一條錯誤(event),讓主從同步恢復正常。(或者N條event,一條一條跳過)

  stop slave;

  set global sql_slave_skip_counter=1;

  start slave;

 

方法2:跳過所有1032錯誤

更改my.cnf文件,在Replication settings下添加:

  slave-skip-errors = 1032

並重啟數據庫,然后start salve。

注意:因為要重啟數據庫,不推薦,除非錯誤事件太多。

 

方法3:還原被刪除的數據

根據錯誤提示信息,用mysqlbinlog找到該條數據event SQL並逆向手動執行。如delete 改成insert。

本例中,此事件在主服務器Master binlog中的位置是 mysql-bin.000003, end_log_pos 440267874。

1)利用mysqlbinlog工具找出440267874的事件

/usr/local/mysql-5.6.30/bin/mysqlbinlog --base64-output=decode-rows -vv mysql-bin.000003 |grep -A 20 '440267874'

或者/usr/local/mysql-5.6.30/bin/mysqlbinlog --base64-output=decode-rows -vv mysql-bin.000003 --stop-position=440267874 | tail -20

或者usr/local/mysql-5.6.30/bin/mysqlbinlog --base64-output=decode-rows -vv mysql-bin.000003 > decode.log 

( 或者加上參數-d, --database=name 來進一步過濾)

#160923 20:01:27 server id 1223307  end_log_pos 440267874 CRC32 0x134b2cbc      Delete_rows: table id 319 flags: STMT_END_F
### DELETE FROM `db_99ducj`.`tbuservcbgolog`
### WHERE
###   @1=10561502 /* INT meta=0 nullable=0 is_null=0 */
###   @2=1683955 /* INT meta=0 nullable=0 is_null=0 */
###   @3=90003 /* INT meta=0 nullable=0 is_null=0 */
###   @4=0 /* INT meta=0 nullable=0 is_null=0 */
###   @5='2016-09-23 17:02:24' /* DATETIME(0) meta=0 nullable=1 is_null=0 */
###   @6=NULL /* DATETIME(0) meta=0 nullable=1 is_null=1 */
# at 440267874

 

以上為檢索出來的結果,事務語句為:delete from db_99ducj.tbuservcbgolog where @1=10561502 and @2=1683955 ...

其中@1 @2 @3...分別對應表tbuservcbgolog的列名,填補上即可。

我們可以逆向此SQL 將deleter 變成Insert,手動在從庫上執行此Insert SQL,之后restart slave就好了。

 

注:通過Relay Log查找event SQL  http://www.tuicool.com/articles/6RvUnqV

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM