起因:由於需要,要把一張表的一個字段從不是 null 改成 可null,我用的Navicat Premium ,但是在保存的時候,工具無響應了,幾個同事操作都是這樣的,很奇怪,懷疑是不是由於表被鎖了還是什么原因

去數據庫看下:
show processlist;
發現有一個線程很奇怪:這個進程的State是Waiting for table metadata lock ,Info是alter table bus_order modify... 並且Time已經800多秒了
能確定這就是剛才修改字段屬性的保存操作,但是為什么卡死了呢,Google了下Waiting for table metadata lock發現原因了:
原來是有操作這張表的未提交事務,在事務沒有完成之前,這個表上的鎖不會釋放,alter table同樣獲取不到metadata的獨占鎖
通過下面兩個語句,定位到操作該表的未提交事務:
1 select t.trx_mysql_thread_id from information_schema.innodb_trx t; 2 show processlist;
然后kill掉這個線程,再保存,立刻保存成功了。
結論&拓展:
- 情景1:一個較耗時的事務運行的時候,這時進行alter table,就會阻塞DDL,繼而阻塞所有當前表的后續操作
通過show processlist可以看到所操作表上有正在進行的操作(包括讀),此時alter table語句無法獲取到metadata 獨占鎖,會進行等待。
這是最基本的一種情形,這個和mysql 5.6中的online DLL並不沖突。一般alter table的操作過程中,在after create步驟會獲取metadata 獨占鎖,當進行到altering table的過程時(通常是最花時間的步驟),對該表的讀寫都可以正常進行,這就是online ddl的表現,並不會像之前在整個alter table過程中阻塞寫入。(當然,也並不是所有類型的alter操作都能online的,具體可以參見官方手冊:http://dev.mysql.com/doc/refman/5.6/en/innodb-create-index-overview.html)
處理方法: kill 掉 DDL所在的session. - 情景2:存在未提交事務,阻塞DDL,繼而阻塞所有同表的后續操作
通過show processlist看不到TableA上有任何操作,但實際上存在有未提交的事務,可以通過下面的命令查看未提交的事務:
select t.trx_mysql_thread_id from information_schema.innodb_trx t
在事務沒有完成之前,Table上的鎖不會釋放,alter table同樣獲取不到metadata的獨占鎖
處理方法:通過上面的命令找到未提交的事務,然后 kill 掉,讓其回滾。 - 場景3:
通過show processlist看不到TableA上有任何操作,在information_schema.innodb_trx中也沒有任何進行中的事務。這很可能是因為在一個顯式的事務中,對TableA進行了一個失敗的操作(比如查詢了一個不存在的字段),這時事務沒有開始,但是失敗語句獲取到的鎖依然有效,沒有釋放。從performance_schema.events_statements_current表中可以查到失敗的語句。
官方手冊上對此的說明如下:
If the server acquires metadata locks for a statement that is syntactically valid but fails during execution, it does not release the locks early. Lock release is still deferred to the end of the transaction because the failed statement is written to the binary log and the locks protect log consistency.
也就是說除了語法錯誤,其他錯誤語句獲取到的鎖在這個事務提交或回滾之前,仍然不會釋放掉。because the failed statement is written to the binary log and the locks protect log consistency 但是解釋這一行為的原因很難理解,因為錯誤的語句根本不會被記錄到二進制日志。
處理方法:通過performance_schema.events_statements_current找到其sid, kill 掉該session. 也可以 kill 掉DDL所在的session.
總之,alter table的語句是很危險的(其實他的危險其實是未提交事物或者長事務導致的),在操作之前最好確認對要操作的表沒有任何進行中的操作、沒有未提交事務、也沒有顯式事務中的報錯語句。如果有alter table的維護任務,在無人監管的時候運行,最好通過lock_wait_timeout設置好超時時間,避免長時間的metedata鎖等待。
