InnoDB鎖問題
InnoDB與MyISAM的最大不同有兩點:一是支持事務(TRANSACTION);二是采用了行級鎖。行級鎖與表級鎖本來就有許多不同之處,另外,事務的引入也帶來了一些新問題。下面我們先介紹一點背景知識,然后詳細討論InnoDB的鎖問題。
背景知識
1.事務(Transaction)及其ACID屬性
事務是由一組SQ語句組成的邏輯處理單元,事務具有以下4個屬性,通常簡稱為事務的ACID屬性。
原子性(Atomicity):事務是一個原子操作單元,其對數據的修改,要么全都執行,要么全都不執行。
一致性(Consistent):在事務開始和完成時,數據都必須保持一致狀態。這意味着所有相關的數據規則都必須應用於事務的修改,以保持數據的完整性;事務結束時,所有的內部數據結構(如B樹索引或雙向鏈表)也都必須是正確的。
隔離性(Isoation):數據庫系統提供一定的隔離機制,保證事務在不受外部並發操作影響的“獨立”環境執行。這意味着事務處理過程中的中間狀態對外部是不可見的,反之亦然。
持久性(Durabe):事務完成之后,它對於數據的修改是永久性的,即使出現系統故障也能夠保持。
銀行轉帳就是事務的一個典型例子。
2.並發事務處理帶來的問題
相對於串行處理來說,並發事務處理能大大增加數據庫資源的利用率,提高數據庫系統的事務吞吐量,從而可以支持更多的用戶。但並發事務處理也會帶來一些問題,主要包括以下幾種情況。
更新丟失(ost Update):當兩個或多個事務選擇同一行,然后基於最初選定的值更新該行時,由於每個事務都不知道其他事務的存在,就會發生丟失更新問題--最后的更新覆蓋了由其他事務所做的更新。例如,兩個編輯人員制作了同一文檔的電子副本。每個編輯人員獨立地更改其副本,然后保存更改后的副本,這樣就覆蓋了原始文檔。最后保存其更改副本的編輯人員覆蓋另一個編輯人員所做的更改。如果在一個編輯人員完成並提交事務之前,另一個編輯人員不能訪問同一文件,則可避免此問題。
臟讀(Dirty Reads):一個事務正在對一條記錄做修改,在這個事務完成並提交前,這條記錄的數據就處於不一致狀態;這時,另一個事務也來讀取同一條記錄,如果不加控制,第二個事務讀取了這些“臟”數據,並據此做進一步的處理,就會產生未提交的數據依賴關系。這種現象被形象地叫做"臟讀"。
不可重復讀(Non-Repeatabe Reads):一個事務在讀取某些數據后的某個時間,再次讀取以前讀過的數據,卻發現其讀出的數據已經發生了改變、或某些記錄已經被刪除了!這種現象就叫做“不可重復讀”。
幻讀(Phantom Reads):一個事務按相同的查詢條件重新讀取以前檢索過的數據,卻發現其他事務插入了滿足其查詢條件的新數據,這種現象就稱為“幻讀”。
3.事務隔離級別
在上面講到的並發事務處理帶來的問題中,“更新丟失”通常是應該完全避免的。但防止更新丟失,並不能單靠數據庫事務控制器來解決,需要應用程序對要更新的數據加必要的鎖來解決,因此,防止更新丟失應該是應用的責任。
“臟讀”、“不可重復讀”和“幻讀”,其實都是數據庫讀一致性問題,必須由數據庫提供一定的事務隔離機制來解決。數據庫實現事務隔離的方式,基本上可分為以下兩種。
一種是在讀取數據前,對其加鎖,阻止其他事務對數據進行修改。
另一種是不用加任何鎖,通過一定機制生成一個數據請求時間點的一致性數據快照(Snapshot),並用這個快照來提供一定級別(語句級或事務級)的一致性讀取。從用戶的角度來看,好象是數據庫可以提供同一數據的多個版本,因此,這種技術叫做數據多版本並發控制(MutiVersion Concurrency Contro,簡稱MVCC或MCC),也經常稱為多版本數據庫。
數據庫的事務隔離越嚴格,並發副作用越小,但付出的代價也就越大,因為事務隔離實質上就是使事務在一定程度上 “串行化”進行,這顯然與“並發”是矛盾的。同時,不同的應用對讀一致性和事務隔離程度的要求也是不同的,比如許多應用對“不可重復讀”和“幻讀”並不敏感,可能更關心數據並發訪問的能力。
為了解決“隔離”與“並發”的矛盾,ISO/ANSI SQ92定義了4個事務隔離級別,每個級別的隔離程度不同,允許出現的副作用也不同,應用可以根據自己的業務邏輯要求,通過選擇不同的隔離級別來平衡 “隔離”與“並發”的矛盾。表20-5很好地概括了這4個隔離級別的特性。
最后要說明的是:各具體數據庫並不一定完全實現了上述4個隔離級別,例如,Oracle只提供Read committed和Serializable兩個標准隔離級別,另外還提供自己定義的Read only隔離級別;SQL Server除支持上述ISO/ANSI SQL92定義的4個隔離級別外,還支持一個叫做“快照”的隔離級別,但嚴格來說它是一個用MVCC實現的Serializable隔離級別。MySQL 支持全部4個隔離級別,但在具體實現時,有一些特點,比如在一些隔離級別下是采用MVCC一致性讀,但某些情況下又不是,這些內容在后面的章節中將會做進 一步介紹。
獲取InnoDB行鎖爭用情況
- mysql> show status like 'innodb_row_lock%';
- +-------------------------------+-------+
- | Variable_name | Value |
- +-------------------------------+-------+
- | InnoDB_row_lock_current_waits | 0 |
- | InnoDB_row_lock_time | 0 |
- | InnoDB_row_lock_time_avg | 0 |
- | InnoDB_row_lock_time_max | 0 |
- | InnoDB_row_lock_waits | 0 |
- +-------------------------------+-------+
- 5 rows in set (0.01 sec)
- mysql> CREATE TABLE innodb_monitor(a INT) ENGINE=INNODB;
- Query OK, 0 rows affected (0.14 sec)
- mysql> Show innodb status\G;
- *************************** 1. row ***************************
- Type: InnoDB
- Name:
- Status:
- mysql> DROP TABLE innodb_monitor;
- Query OK, 0 rows affected (0.05 sec)
InnoDB的行鎖模式及加鎖方法
InnoDB實現了以下兩種類型的行鎖。
共享鎖(S):允許一個事務去讀一行,阻止其他事務獲得相同數據集的排他鎖。
排他鎖(X):允許獲得排他鎖的事務更新數據,阻止其他事務取得相同數據集的共享讀鎖和排他寫鎖。
另外,為了允許行鎖和表鎖共存,實現多粒度鎖機制,InnoDB還有兩種內部使用的意向鎖(Intention Locks),這兩種意向鎖都是表鎖。
意向共享鎖(IS):事務打算給數據行加行共享鎖,事務在給一個數據行加共享鎖前必須先取得該表的IS鎖。
意向排他鎖(IX):事務打算給數據行加行排他鎖,事務在給一個數據行加排他鎖前必須先取得該表的IX鎖。
上述鎖模式的兼容情況具體如表20-6所示。
如果一個事務請求的鎖模式與當前的鎖兼容,InnoDB就將請求的鎖授予該事務;反之,如果兩者不兼容,該事務就要等待鎖釋放。
意向鎖是InnoDB自動加的,不需用戶干預。對於UPDATE、DELETE和INSERT語句,InnoDB會自動給涉及數據集加排他鎖(X);對於普通SELECT語句,InnoDB不會加任何鎖;事務可以通過以下語句顯示給記錄集加共享鎖或排他鎖。
共享鎖(S):SELECT * FROM table_name WHERE ... LOCK IN SHARE MODE。
排他鎖(X):SELECT * FROM table_name WHERE ... FOR UPDATE。
用SELECT ... IN SHARE MODE獲得共享鎖,主要用在需要數據依存關系時來確認某行記錄是否存在,並確保沒有人對這個記錄進行UPDATE或者DELETE操作。但是如果當前事務也需要對該記錄進行更新操作,則很有可能造成死鎖,對於鎖定行記錄后需要進行更新操作的應用,應該使用SELECT... FOR UPDATE方式獲得排他鎖。
在如表20-7所示的例子中,使用了SELECT ... IN SHARE MODE加鎖后再更新記錄,看看會出現什么情況,其中actor表的actor_id字段為主鍵。
當使用SELECT...FOR UPDATE加鎖后再更新記錄,出現如表20-8所示的情況。
InnoDB行鎖是通過給索引上的索引項加鎖來實現的,這一點MySQL與Oracle不同,后者是通過在數據塊中對相應數據行加鎖來實現的。InnoDB這種行鎖實現特點意味着:只有通過索引條件檢索數據,InnoDB才使用行級鎖,否則,InnoDB將使用表鎖!
在實際應用中,要特別注意InnoDB行鎖的這一特性,不然的話,可能導致大量的鎖沖突,從而影響並發性能。下面通過一些實際例子來加以說明。
(1)在不通過索引條件查詢的時候,InnoDB確實使用的是表鎖,而不是行鎖。在如表20-9所示的例子中,開始tab_no_index表沒有索引:
- mysql> create table tab_no_index(id int,name varchar(10)) engine=innodb;
- Query OK, 0 rows affected (0.15 sec)
- mysql> insert into tab_no_index values(1,'1'),(2,'2'),(3,'3'),(4,'4');
- Query OK, 4 rows affected (0.00 sec)
- Records: 4 Duplicates: 0 Warnings: 0
創建tab_with_index表,id字段有普通索引:
- mysql> create table tab_with_index(id int,name varchar(10)) engine=innodb;
- Query OK, 0 rows affected (0.15 sec)
- mysql> alter table tab_with_index add index id(id);
- Query OK, 4 rows affected (0.24 sec)
- Records: 4 Duplicates: 0 Warnings: 0
- mysql> alter table tab_with_index drop index name;
- Query OK, 4 rows affected (0.22 sec)
- Records: 4 Duplicates: 0 Warnings: 0
- mysql> insert into tab_with_index values(1,'4');
- Query OK, 1 row affected (0.00 sec)
- mysql> select * from tab_with_index where id = 1;
- +------+------+
- | id | name |
- +------+------+
- | 1 | 1 |
- | 1 | 4 |
- +------+------+
- 2 rows in set (0.00 sec)
(3)當表有多個索引的時候,不同的事務可以使用不同的索引鎖定不同的行,另外,不論是使用主鍵索引、唯一索引或普通索引,InnoDB都會使用行鎖來對數據加鎖。
在如表20-12所示的例子中,表tab_with_index的id字段有主鍵索引,name字段有普通索引:
- mysql> alter table tab_with_index add index name(name);
- Query OK, 5 rows affected (0.23 sec)
- Records: 5 Duplicates: 0 Warnings: 0
(4)即便在條件中使用了索引字段,但是否使用索引來檢索數據是由MySQL通過判斷不同執行計划的代價來決定的,如果MySQL認為全表掃描效率更高,比如對一些很小的表,它就不會使用索引,這種情況下InnoDB將使用表鎖,而不是行鎖。因此,在分析鎖沖突時,別忘了檢查SQL的執行計划,以確認是否真正使用了索引。關於MySQL在什么情況下不使用索引的詳細討論,參見本章“索引問題”一節的介紹。
在下面的例子中,檢索值的數據類型與索引字段不同,雖然MySQL能夠進行數據類型轉換,但卻不會使用索引,從而導致InnoDB使用表鎖。通過用explain檢查兩條SQL的執行計划,我們可以清楚地看到了這一點。
例子中tab_with_index表的name字段有索引,但是name字段是varchar類型的,如果where條件中不是和varchar類型進行比較,則會對name進行類型轉換,而執行的全表掃描。
- mysql> alter table tab_no_index add index name(name);
- Query OK, 4 rows affected (8.06 sec)
- Records: 4 Duplicates: 0 Warnings: 0
- mysql> explain select * from tab_with_index where name = 1 \G
- *************************** 1. row ***************************
- id: 1
- select_type: SIMPLE
- table: tab_with_index
- type: ALL
- possible_keys: name
- key: NULL
- key_len: NULL
- ref: NULL
- rows: 4
- Extra: Using where
- 1 row in set (0.00 sec)
- mysql> explain select * from tab_with_index where name = '1' \G
- *************************** 1. row ***************************
- id: 1
- select_type: SIMPLE
- table: tab_with_index
- type: ref
- possible_keys: name
- key: name
- key_len: 23
- ref: const
- rows: 1
- Extra: Using where
- 1 row in set (0.00 sec)
在上面的例子中,只是簡單地讀 source_tab表的數據,相當於執行一個普通的SELECT語句,用一致性讀就可以了。ORACLE正是這么做的,它通過MVCC技術實現的多版本 數據來實現一致性讀,不需要給source_tab加任何鎖。我們知道InnoDB也實現了多版本數據,對普通的SELECT一致性讀,也不需要加任何 鎖;但這里InnoDB卻給source_tab加了共享鎖,並沒有使用多版本數據一致性讀技術!