MySQL中InnoDB存儲引擎的實現和運行原理


InnoDB 存儲引擎作為我們最常用到的存儲引擎之一,充分熟悉它的的實現和運行原理,有助於我們更好地創建和維護數據庫表。

InnoDB 體系架構

  • InnoDB 主要包括了: 內存池、后台線程以及存儲文件。

  • 內存池又是由多個內存塊組成的,主要包括緩存磁盤數據、redo log 緩沖等;

  • 后台線程則包括了 : Master ThreadIO Thread 以及 Purge Thread 等;

  • 由 InnoDB 存儲引擎實現的表的存儲結構文件一般包括表結構文件(.frm)、共享表空間文件(ibdata1)、獨占表空間文件(ibd)以及日志文件(redo 文件等)等。

1. 內存池

我們知道,如果客戶端從數據庫中讀取數據是直接從磁盤讀取的話,無疑會帶來一定的性能瓶頸,緩沖池的作用就是提高整個數據庫的讀寫性能。

客戶端讀取數據時,如果數據存在於緩沖池中, 客戶端就會直接讀取緩沖池中的數據,否則再去磁盤中讀取;對於數據庫中的修改數據,首先是修改在緩沖池中的數據,然后再通過 Master Thread 線程刷新到磁盤上。

理論上來說,緩沖池的內存越大越好。 緩沖池中不僅緩存索引頁和數據頁,還包括了 undo 頁,插入緩存、自適應哈希索引以及 InnoDB 地鎖信息等等。

InnoDB 允許多個緩沖池實例,從而減少數據庫內部資源的競爭,增強數據庫的並發處理能力。

InnoDB 存儲引擎會先將重做日志信息放入到緩沖區中,然后再刷新到重做日志文件中。

2. 后台線程

Master Thread 主要負責將緩沖池中的數據異步刷新到磁盤中, 除此之外還包括插入緩存、undo 頁的回收等,IO Thread 是負責讀寫 IO 的線程,Purge Thread 主要用於回收事務已經提交了的 undo logPager Cleaner Thread 是新引入的一個用於協助 Master Thread 刷新臟頁到磁盤的線程,它可以減輕 Master Thread 的工作壓力,減少阻塞。

3. 存儲文件

在 MySQL 中建立一張表都會生成一個.frm 文件,該文件是用來保存每個表的元數據信息的,主要包含表結構定義。

InnoDB 中,存儲數據都是按表空間進行存放的,默認為共享表空間, 存儲的文件即為共享表空間文件(ibdata1)。若設置了參數 innodb_file_per_table 為 1,則會將存儲的數據、索引等信息單獨存儲在一個獨占表空間,因此也會產生一個獨占表空間文件(ibd)。如果你對共享表空間和獨占表空間的理解還不夠透徹,接下來我會詳解。

而日志文件則主要是重做日志文件,主要記錄事務產生的重做日志,保證事務的一致性。

InnoDB 邏輯存儲結構

InnoDB 邏輯存儲結構分為表空間(Tablespace)、段 (Segment)、區 (Extent)、頁 Page) 以及行 (row)。

1. 表空間(Tablespace)

InnoDB 提供了兩種表空間存儲數據的方式,一種是共享表空間,一種是獨占表空間。 InnoDB 默認會將其所有的表數據存儲在一個共享表空間中,即 ibdata1。

我們可以通過設置 innodb_file_per_table 參數為 1(1 代表獨占方式)開啟獨占表空間模式。開啟之后,每個表都有自己獨立的表空間物理文件,所有的數據以及索引都會存儲在該文件中,這樣方便備份以及恢復數據。

2. 段 (Segment)

表空間是由各個段組成的,段一般分為數據段、索引段和回滾段等。我們知道,InnoDB 默認是基於 B + 樹實現的數據存儲。

這里的索引段則是指的 B + 樹的非葉子節點,而數據段則是 B + 樹的葉子節點。而回滾段則指的是回滾數據。

3. 區 (Extent) / 頁(Page)

區是表空間的單元結構,每個區的大小為 1MB。而頁是組成區的最小單元, 頁也是 InnoDB 存儲引擎磁盤管理的最小單元,每個頁的大小默認為 16KB。為了保證頁的連續性,InnoDB 存儲引擎每次從磁盤申請 4-5 個區。

4. 行(Row)

InnoDB 存儲引擎是面向列的(row-oriented),也就是說數據是按行進行存放的,每個頁存放的行記錄也是有硬性定義的,最多允許存放 16KB/2-200 行,即 7992 行記錄。

InnoDB 事務之 redo log 工作原理

InnoDB 是一個事務性的存儲引擎, 而 InnoDB 的事務實現是基於事務日志 redo logundo log 實現的。redo log 是重做日志,提供再寫入操作,實現事務的持久性;undo log 是回滾日志,提供回滾操作,保證事務的一致性。

redo log 又包括了內存中的日志緩沖(redo log buffer) 以及保存在磁盤的重做日志文件(redo log file),前者存儲在內存中,容易丟失,后者持久化在磁盤中,不會丟失。

InnoDB 的更新操作采用的是 Write Ahead Log 策略,即先寫日志,再寫入磁盤。 當一條記錄更新時,InnoDB 會先把記錄寫入到 redo log buffer 中,並更新內存數據。我們可以通過參數
innodb_flush_log_at_trx_commit 自定義 commit 時,如何將 redo log buffer 中的日志刷新到 redo log file 中。

在這里,我們需要注意的是 InnoDBredo log 的大小是固定的, 分別有多個日志文件采用循環方式組成一個循環閉環,當寫到結尾時,會回到開頭循環寫日志。我們可以通過參數 innodb_log_files_in_groupinnodb_log_file_size 配置日志文件數量和每個日志文件的大小。

Buffer Pool 中更新的數據未刷新到磁盤中,該內存頁我們稱之為臟頁。 最終臟頁的數據會刷新到磁盤中,將磁盤中的數據覆蓋,這個過程與 redo log 不一定有關系。

只有當 redo log 日志滿了的情況下,才會主動觸發臟頁刷新到磁盤, 而臟頁不僅只有 redo log 日志滿了的情況才會刷新到磁盤,以下幾種情況同樣會觸發臟頁的刷新:

  • 系統內存不足時,需要將一部分數據頁淘汰掉,如果淘汰的是臟頁,需要先將臟頁同步到磁盤;
  • MySQL 認為空閑的時間,這種情況沒有性能問題;
  • MySQL 正常關閉之前,會把所有的臟頁刷入到磁盤,這種情況也沒有性能問題。

在生產環境中,如果我們開啟了慢 SQL 監控,你會發現偶爾會出現一些用時稍長的 SQL。 這是因為臟頁在刷新到磁盤時可能會給數據庫帶來性能開銷,導致數據庫操作抖動。

LRU 淘汰策略

以上我們了解了 InnoDB 的更新和插入操作的具體實現原理,接下來我們再來了解下它的實現和優化方式。

InnoDB 存儲引擎是基於集合索引實現的數據存儲,也就是除了索引列以及主鍵是存儲在 B + 樹之外, 其它列數據也存儲在 B + 樹的葉子節點中。而這里的索引頁和數據頁都會緩存在緩沖池中,在查詢數據時,只要在緩沖池中存在該數據,InnoDB 就不用每次都去磁盤中讀取頁,從而提高數據庫的查詢性能。

雖然緩沖池是一個很大的內存區域,但由於存放了各種類型的數據, 加上存儲數據量之大,緩沖池無法將所有的數據都存儲在其中。因此,緩沖池需要通過 LRU 算法將最近且經常查詢的數據緩存在其中,而不常查詢的數據就淘汰出去。

InnoDB 對 LRU 做了一些優化, 我們熟悉的 LRU 算法通常是將最近查詢的數據放到 LRU 列表的首部,而 InnoDB 則是將數據放在一個 midpoint 位置,通常這個 midpoint 為列表長度的 5/8。

這種策略主要是為了避免一些不常查詢的操作突然將熱點數據淘汰出去,而熱點數據被再次查詢時,需要再次從磁盤中獲取,從而影響數據庫的查詢性能。

如果我們的熱點數據比較多,我們可以通過調整 midpoint 值來增加熱點數據的存儲量,從而降低熱點數據的淘汰率。

總結

以上 InnoDB 的實現和運行原理到這里就介紹完了。 總的來講,作為開發工程師,我們應該掌握數據庫幾個大的知識點,然后再深入到數據庫內部實現的細節,這樣才能避免經常寫出一些具有性能問題的 SQL,培養調優數據庫性能的能力。

看完三件事❤️


如果你覺得這篇內容對你還蠻有幫助,我想邀請你幫我三個小忙:

  1. 點贊,轉發,有你們的 『點贊和評論』,才是我創造的動力。
  2. 關注公眾號 『 阿風的架構筆記 』,不定期分享原創知識。
  3. 同時可以期待后續文章ing🚀
  4. 關注后回復【666】掃碼即可獲取架構進階學習資料包


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM