索引讓數據庫查詢變快的原因


使用過數據庫的朋友一定都很熟悉索引,也知道他的作用就是增加查詢速度。最常見的索引是 B+Tree 索引(B樹索引),索引可以加快數據庫的檢索速度,但是會降低新增、修改、刪除操作的速度,一些錯誤的寫法會導致索引失效等等(具體哪些原因會導致索引失效,后續在其他文章我會分享)。但是如果有人問你,為什么所以你能提高查詢速度?或者說B+Tree 索引的原理是什么?這時候很多人可能就不知道了,今天我就以 MySQL 的 InnoDB 引擎為例,講一講 B+ Tree 索引的原理。看完大家應該就能夠回答這個問題了。

索引的基礎知識

MySQL 的基本存儲結構是頁,大概就是這個樣子的:(本文圖片來源:https://mp.weixin.qq.com/s/WpbwJRqFVjBtd4luckUotA)

 

在這里,我們需要了解以下幾點(非常重要):

  • 當我們用 MySQL 的 InnoDB 引擎創建表,有且只能有一個主鍵;如果我們沒有顯示地指定主鍵,那么MySQL 會自動生成一個隱含字段作為主鍵;
  • 聚集索引:以主鍵創建的索引;聚集索引的葉子節點存儲的是表中的數據;
  • 非聚集索引:非主鍵創建的索引;非聚集索引在葉子節點存儲的是主鍵和索引列;使用非聚集索引查詢數據,會查詢到葉子上的主鍵,再根據主鍵查到數據(這個過程叫做回表)。

mysql頁和頁之間、頁和數據之間的關系

我們以聚集索引做講解,頁和頁之間、以及頁和數據之間的關系是這樣的:

  • 數據頁和數據頁之間,組成一個雙向鏈表;
  • 每個數據頁中的記錄,是一個單向鏈表;
  • 每個數據頁都根據內部的記錄生成一個頁目錄(Page directory),如果是主鍵的話,可以在頁目錄中使用二分法快速定位;
  • 如果我們根據一個非主鍵、非索引列進行查詢,那么需要遍歷雙向鏈表,找到所在的頁;再遍歷頁內的單向鏈表;如果表內數據很大的話,這樣的查詢就會很慢。

B+Tree索引的原理

  先讓我們看看 B+ Tree 索引大概是什么樣子,依舊以聚集/主鍵索引為例:

 

  • 假如這時候我們要查詢 id = 16 的數據:
  • 查詢頁-1,找到頁-2 存儲的是小於 30 的數據;
  • 查詢頁-2,找到頁-5 存儲的是 10~20 的數據;
  • 查詢頁-5,找到 id = 16 的數據。

       很顯然,沒有用索引的時候,需要遍歷雙向鏈表來定位對應的頁,而有了索引,則可以通過一層層“目錄”定位到對應的頁上

       怎么樣,原理是不是很簡單,文中標黃的文字就解釋了本文的主題。

B+Tree為什么會降低增刪改的速率?

B+Tree是一顆平衡樹,如果對這顆樹新增、修改、刪除的話,會破壞它的原有結構;我們在做數據新增、修改、刪除的時候,需要花額外的時間去維護索引;正因為這些額外的開銷,導致索引會降低新增、修改、刪除的速度。

最后大家還可以思考下,為什么官方建議使用自增長主鍵作為索引?下一篇文章詳解次問題。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM