面試題：MySQL索引為什么用B+樹？

前言

講到索引，第一反應肯定是能提高查詢效率。例如書的目錄，想要查找某一章節，會先從目錄中定位。如果沒有目錄，那么就需要將所有內容都看一遍才能找到。

索引的設計對程序的性能至關重要，若索引太少，對查詢性能受影響；而如果索引太多，則會影響增/改/刪等的性能。

MySQL中一般支持以下幾種常見的索引：

我們今天重點來講下B+樹索引，以及為什么要用B+樹來作為索引的數據結構。

B+樹索引並不能直接找到具體的行，只是找到被查找行所在的頁，然后DB通過把整頁讀入內存，再在內存中查找。

如有 3、1、2、10、9、0、4、6這8個數據，建立如圖1-1所示哈希索引。

圖1-1 哈希索引

二叉樹是一種經典的數據結構，要求左子樹小於根節點，右子樹大於根節點。

如有 3、1、2、10、9、0、4、6這8個數據，建立如圖1-2所示二分查找樹。

直接查詢：假設查找鍵值為6的記錄，先找到根4，4<6，因此查找4的右子樹，找到9；9大於6，因此查找9的左子樹；一共查找3次。但如果順序查找，則需要查找8次（位於最后）。
范圍查詢：如果需要查找大於4的數據，則遍歷4的右子樹就行了。

圖1-2 二叉查找樹

按照二叉查找樹的定義，它是可以任意的構造，同樣是這些數字，可以按照圖1-3-1的方式來建立二叉查找樹。同樣查找數據6，需要查找5次。

圖1-3-1 性能較差的二叉查找樹

因此為了最大性能地構造一個二叉查找樹，需要它是平衡的，即平衡二叉樹。

平衡二叉樹定義：首先符合二叉查找樹的定義，另外任何節點的兩個子樹高度最大差為1。

平衡二叉樹的查詢速度是很快的，但是有缺點：

圖1-3-2 平衡二叉樹AVL

在B+樹中，所有記錄節點存放在葉子節點上，且是順序存放，由各葉子節點指針進行連接。如果從最左邊的葉子節點開始順序遍歷，能得到所有鍵值的順序排序。

如有 3、1、2、10、9、0、4、6這8個數據，可建立如圖1-4-1所示高度為2的B+樹。

圖1-4-1 高度為2的B+樹

在進行更新時，B+樹同樣需要類似二叉樹的旋轉操作。舉例，假設新增一個7，那可以直接填充到4、6的后面。如果再添加8，那么就需要進行旋轉了，感受下面的B+樹旋轉過程。

圖1-4-2 高度為3的B+樹

采用B+樹的索引結構優點：

B+樹的高度一般為2-4層，所以查找記錄時最多只需要2-4次IO，相對二叉平衡樹已經大大降低了。
范圍查找時，能通過葉子節點的指針獲取數據。例如查找大於等於3的數據，當在葉子節點中查到3時，通過3的尾指針便能獲取所有數據，而不需要再像二叉樹一樣再獲取到3的父節點。

未完待續…

原文鏈接：

面試題：MySQL索引為什么用B+樹？ - 掘金 https://juejin.im/post/5ce50d866fb9a07eb94f626c

MySQL索引（一）為什么要用B+樹-知否專欄 https://mp.weixin.qq.com/s/dhGAUs-S3RbBaOL2yxh1Iw