【原創】互聯網項目中mysql應該選什么事務隔離級別


摘要

企業千萬家,靠譜沒幾家。
社招選錯家,親人兩行淚。

祝大家金三銀四跳槽順利!

引言

開始我們的內容,相信大家一定遇到過下面的一個面試場景

面試官:“講講mysql有幾個事務隔離級別?”
你:“讀未提交,讀已提交,可重復讀,串行化四個!默認是可重復讀”
面試官:“為什么mysql選可重復讀作為默認的隔離級別?”
(你面露苦色,不知如何回答!)
面試官:"你們項目中選了哪個隔離級別?為什么?"
你:“當然是默認的可重復讀,至於原因。。呃。。。”
(然后你就可以回去等通知了!)

為了避免上述尷尬的場景,請繼續往下閱讀!
Mysql默認的事務隔離級別是可重復讀(Repeatable Read),那互聯網項目中Mysql也是用默認隔離級別,不做修改么?
OK,不是的,我們在項目中一般用讀已提交(Read Commited)這個隔離級別!
what!居然是讀已提交,網上不是說這個隔離級別存在不可重復讀幻讀問題么?不用管么?好,帶着我們的疑問開始本文!

正文

我們先來思考一個問題,在Oracle,SqlServer中都是選擇讀已提交(Read Commited)作為默認的隔離級別,為什么Mysql不選擇讀已提交(Read Commited)作為默認隔離級別,而選擇可重復讀(Repeatable Read)作為默認的隔離級別呢?

Why?Why?Why?

這個是有歷史原因的,當然要從我們的主從復制開始講起了!
主從復制,是基於什么復制的?
是基於binlog復制的!這里不想去搬binlog的概念了,就簡單理解為binlog是一個記錄數據庫更改的文件吧~
binlog有幾種格式?
OK,三種,分別是

  • statement:記錄的是修改SQL語句
  • row:記錄的是每行實際數據的變更
  • mixed:statement和row模式的混合

那Mysql在5.0這個版本以前,binlog只支持STATEMENT這種格式!而這種格式在讀已提交(Read Commited)這個隔離級別下主從復制是有bug的,因此Mysql將可重復讀(Repeatable Read)作為默認的隔離級別!
接下來,就要說說當binlog為STATEMENT格式,且隔離級別為讀已提交(Read Commited)時,有什么bug呢?如下圖所示,在主(master)上執行如下事務

此時在主(master)上執行下列語句

select * from test;

輸出如下

+---+
| b |
+---+
| 3 |
+---+
1 row in set

但是,你在此時在從(slave)上執行該語句,得出輸出如下

Empty set

這樣,你就出現了主從不一致性的問題!原因其實很簡單,就是在master上執行的順序為先刪后插!而此時binlog為STATEMENT格式,它記錄的順序為先插后刪!從(slave)同步的是binglog,因此從機執行的順序和主機不一致!就會出現主從不一致!
如何解決?
解決方案有兩種!
(1)隔離級別設為可重復讀(Repeatable Read),在該隔離級別下引入間隙鎖。當Session 1執行delete語句時,會鎖住間隙。那么,Ssession 2執行插入語句就會阻塞住!
(2)將binglog的格式修改為row格式,此時是基於行的復制,自然就不會出現sql執行順序不一樣的問題!奈何這個格式在mysql5.1版本開始才引入。因此由於歷史原因,mysql將默認的隔離級別設為可重復讀(Repeatable Read),保證主從復制不出問題!

那么,當我們了解完mysql選可重復讀(Repeatable Read)作為默認隔離級別的原因后,接下來我們將其和讀已提交(Read Commited)進行對比,來說明為什么在互聯網項目為什么將隔離級別設為讀已提交(Read Commited)

對比

ok,我們先明白一點!項目中是不用讀未提交(Read UnCommitted)串行化(Serializable)兩個隔離級別,原因有二

  • 采用讀未提交(Read UnCommitted),一個事務讀到另一個事務未提交讀數據,這個不用多說吧,從邏輯上都說不過去!
  • 采用串行化(Serializable),每個次讀操作都會加鎖,快照讀失效,一般是使用mysql自帶分布式事務功能時才使用該隔離級別!(筆者從未用過mysql自帶的這個功能,因為這是XA事務,是強一致性事務,性能不佳!互聯網的分布式方案,多采用最終一致性的事務解決方案!)

也就是說,我們該糾結都只有一個問題,究竟隔離級別是用讀已經提交呢還是可重復讀?
接下來對這兩種級別進行對比,講講我們為什么選讀已提交(Read Commited)作為事務隔離級別!
假設表結構如下

 CREATE TABLE `test` (
`id` int(11) NOT NULL,
`color` varchar(20) NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB

數據如下

+----+-------+
| id | color |
+----+-------+
|  1 |  red  |
|  2 | white |
|  5 |  red  |
|  7 | white |
+----+-------+

為了便於描述,下面將

  • 可重復讀(Repeatable Read),簡稱為RR;
  • 讀已提交(Read Commited),簡稱為RC;

緣由一:在RR隔離級別下,存在間隙鎖,導致出現死鎖的幾率比RC大的多!
此時執行語句

select * from test where id <3 for update;

在RR隔離級別下,存在間隙鎖,可以鎖住(2,5)這個間隙,防止其他事務插入數據!
而在RC隔離級別下,不存在間隙鎖,其他事務是可以插入數據!

ps:在RC隔離級別下並不是不會出現死鎖,只是出現幾率比RR低而已!

緣由二:在RR隔離級別下,條件列未命中索引會鎖表!而在RC隔離級別下,只鎖行
此時執行語句

update test set color = 'blue' where color = 'white'; 

在RC隔離級別下,其先走聚簇索引,進行全部掃描。加鎖如下:

但在實際中,MySQL做了優化,在MySQL Server過濾條件,發現不滿足后,會調用unlock_row方法,把不滿足條件的記錄放鎖。
實際加鎖如下

然而,在RR隔離級別下,走聚簇索引,進行全部掃描,最后會將整個表鎖上,如下所示

緣由三:在RC隔離級別下,半一致性讀(semi-consistent)特性增加了update操作的並發性!
在5.1.15的時候,innodb引入了一個概念叫做“semi-consistent”,減少了更新同一行記錄時的沖突,減少鎖等待。
所謂半一致性讀就是,一個update語句,如果讀到一行已經加鎖的記錄,此時InnoDB返回記錄最近提交的版本,由MySQL上層判斷此版本是否滿足update的where條件。若滿足(需要更新),則MySQL會重新發起一次讀操作,此時會讀取行的最新版本(並加鎖)!
具體表現如下:
此時有兩個Session,Session1和Session2!
Session1執行

update test set color = 'blue' where color = 'red'; 

先不Commit事務!
與此同時Ssession2執行

update test set color = 'blue' where color = 'white'; 

session 2嘗試加鎖的時候,發現行上已經存在鎖,InnoDB會開啟semi-consistent read,返回最新的committed版本(1,red),(2,white),(5,red),(7,white)。MySQL會重新發起一次讀操作,此時會讀取行的最新版本(並加鎖)!
而在RR隔離級別下,Session2只能等待!

兩個疑問

在RC級別下,不可重復讀問題需要解決么?
不用解決,這個問題是可以接受的!畢竟你數據都已經提交了,讀出來本身就沒有太大問題!Oracle的默認隔離級別就是RC,你們改過Oracle的默認隔離級別么?

在RC級別下,主從復制用什么binlog格式?
OK,在該隔離級別下,用的binlog為row格式,是基於行的復制!Innodb的創始人也是建議binlog使用該格式!

總結

本文啰里八嗦了一篇文章只是為了說明一件事,互聯網項目請用:讀已提交(Read Commited)這個隔離級別!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM